扩散模型训练方法一直错了！谢赛宁：Representation matters

深度学习基础与进阶 · 公众号 · · 2024-10-14 14:11

文章预览

机器之心报道编辑：Panda、小舟 Representation matters. Representation matters. Representation matters. 是什么让纽约大学著名研究者谢赛宁三连呼喊「Representation matters」？他表示：「我们可能一直都在用错误的方法训练扩散模型。」即使对生成模型而言，表征也依然有用。基于此，他们提出了 REPA，即表征对齐技术，其能让「训练扩散 Transformer 变得比你想象的更简单。」 Yann LeCun 也对他们的研究表示了认可：「我们知道，当使用自监督学习训练视觉编码器时，使用具有重构损失的解码器的效果远不如使用具有特征预测损失和崩溃预防机制的联合嵌入架构。这篇来自纽约大学 @sainingxie 的论文表明，即使你只对生成像素感兴趣（例如使用扩散 Transformer 生成漂亮图片），也应该包含特征预测损失，以便解码器的内部表征可以根据预训练的视觉编码器（例如 DINOv2）预 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

物道 · 一次集齐6大法国风情名奢酒！

12 小时前

美芽 · 耳机戴久了，真的会聋吗？

昨天

CPHI制药在线 · 共襄盛举，擘画未来——CPHI & PMEC China 2024万商沪上云集，喜迎五洲宾客！

8 月前

万能的大熊 · 有公维基金啊今年就换电梯-20240704192526

7 月前

微思教育 · 微思直播 | 左手牛津，右手剑桥！北理学长在线分享名校博士申请攻略

5 月前

海伦融媒 · 纸短情长|贸大学子调研海伦剪纸产业化发展

1 周前