专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
今天看啥  ›  专栏  ›  专知

物理如何用于生成式模型?MIT博士论文《物理启发的生成式模型》

专知  · 公众号  ·  · 2024-09-07 11:00
    

文章预览

物理启发的生成模型(如扩散模型)构成了一类强大的生成模型家族 。该模型家族的优势在于相对稳定的训练过程和强大的容量。然而,仍有许多可能的改进空间。在本论文中,我们首先将深入探讨扩散模型在训练和采样方面的改进技术。扩散模型的训练目标在数据分布为多模态时呈现出较高的方差。为了解决这一问题,我们提出了一种训练目标,它推广了传统的去噪得分匹配方法,显著减少了训练目标的方差。除此之外,我们还引入了一种将可学习的离散潜变量整合到连续扩散模型中的训练框架。这些潜变量简化了扩散模型复杂的噪声到数据映射的学习过程。 另一方面,扩散模型的采样过程通常涉及求解微分方程 。为加速采样过程,我们提出了一种新颖的采样算法,结合了之前常见的ODE和SDE采样器的优点,大幅提升了预训练扩散模型的性能。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览