今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

视觉的高效扩散模型综述

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-06-08 00:15
    

文章预览

22年10月 来自澳大利亚大学 的综述论文“Efficient Diffusion Models for Vision: A Survey“。 摘要 :扩散模型 (DM) 在内容生成中展示了最先进的性能,无需对抗性训练。这些模型用两步过程进行训练。首先,正向扩散过程逐渐向基准(通常是图像)添加噪声。然后,反向扩散过程逐渐消除噪声,将其转换为建模的目标分布样本。DM受到非平衡态热力学的启发,具有固有的高计算复杂度。由于高维空间中频繁的函数评估和梯度计算,这些模型在训练和推理阶段都会产生相当大的计算开销。这不仅会阻碍基于扩散建模的平民化,而且会阻碍扩散模型在实际应用中的适应性。更不用说,由于过度的能耗和环境影响,计算模型效率成为一个重大问题。这篇综述介绍了视觉扩散模型的最新进展,特别关注那些影响扩散模型计算效率的设计。特别强调最近提出的导致更 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览