今天看啥  ›  专栏  ›  智源社区助手

直播|何恺明组 & MIT 热门开源工作,打破自回归图像生成瓶颈

智源社区助手  · 公众号  ·  · 2024-07-23 11:00

文章预览

报告主题 :无需矢量量化的自回归图像生成方法 报告日期 :7月25日(本周四)10:30-11:30 报告要点 : 传统观点认为,自回归的图像生成模型(AR)通常需要在离散的语义符上进行操作。我们观察到,虽然离散空间可以方便地表示语义符的概率分布,但它并不是自回归建模的必要条件。在这篇工作中,我们提出使用扩散过程来模拟每个语义符的概率分布,这使我们能够在连续空间中应用自回归模型。我们没有使用传统的离散交叉熵损失函数,而是定义了一个扩散损失函数来模拟每个标记的概率分布。这种方法消除了自回归模型对离散语义符的依赖。 我们广泛地评估了该方法在不同自回归图像生成模型下的表现,包括标准的自回归模型和广义的掩码自回归(MAR)模型。通过去除离散的语义符,我们的方法不仅能保持自回归生成的速度优势,也拥有强 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览