文章预览
深度概率模型在高维、多模态数据合成和密度估计任务中已成为最新的技术前沿 。通过将抽象的概率公式与神经网络的表达能力和可扩展性相结合,深度概率模型已成为机器学习工具箱中的基本组成部分。然而,这些模型仍然存在一些局限性。例如,深度概率模型通常局限于基于梯度的训练,因此难以结合非可微操作;它们的训练和采样成本较高;并且深度概率模型往往没有利用先验的几何和特定问题的结构知识。 本论文由四部分研究工作组成,通过基于最优传输的仿真方法推动深度概率模型领域的发展 。首先,使用Sinkhorn算法的正则化最优传输,我们提供了一个理论上有依据且可微的粒子滤波中重新采样的近似方法。这使得人们能够通过端到端可微粒子滤波对状态空间模型(一类序列概率模型)进行基于梯度的训练。接下来,我们探讨了Sinkhorn
………………………………