专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

谢赛宁新作爆火,扩散模型新赛道诞生!测试时计算带飞,性能飙到天花板

新智元  · 公众号  · AI  · 2025-01-18 11:44
    

主要观点总结

本文主要介绍了一个由NYU、MIT和谷歌顶尖研究团队共同推出的针对扩散模型的新研究。该研究提出了一个创新性解决方案,通过设计通用搜索框架来提升模型性能,在测试时计算Scaling Law。文章介绍了该研究的关键点,包括验证器与算法的组合、搜索框架的贡献、推理时计算Scaling的分析以及不同验证器与生成任务之间的对齐等。

关键观点总结

关键观点1: 研究团队提出一个创新性解决方案,通过设计通用搜索框架,从两个维度来提升模型性能。

这个框架包括验证器和算法两个部分,验证器用于提供质量反馈,算法则用于寻找更优的噪声候选。

关键观点2: 研究团队确定了搜索框架中的两个关键设计轴:提供反馈的验证器和寻找更好噪声候选项的算法。

通过对不同验证器-算法组合的研究,发现没有一种配置是普遍最优的,每个任务反而需要特定的搜索设置来实现最佳Scaling性能。

关键观点3: 研究分析了验证器与不同生成任务之间的对齐情况,揭示了不同验证器中嵌入的偏差以及每个不同的视觉生成任务中需要专门设计验证器的必要性。

还研究了推理时Scaling作为搜索问题,将推理时Scaling构建为对采样噪声的搜索问题。

关键观点4: 研究展示了搜索框架在文本条件生成任务中的推理时Scaling能力,并分析了搜索算法的性能和搜索与微调兼容性。

此外,还探索了在较小的扩散模型上,推理计算投入的有效性。

关键观点5: 介绍共同一作Nanye Ma和Shangyuan Tong及相关背景。

提供了研究参考链接。


文章预览

   新智元报道   编辑:编辑部 HYZ 【新智元导读】 划时代的突破来了!来自NYU、MIT和谷歌的顶尖研究团队联手,为扩散模型开辟了一个全新的方向——测试时计算Scaling Law。其中,谢赛宁高徒为共同一作。 测试时计算+扩散模型,终于有人做到了! AI大神谢赛宁团队的新作,再次火得一塌糊涂。 众所周知,大模型+测试时计算,是OpenAI笃定的全新Scaling Law。o3横扫千军,就是最好的证明。 那么,扩散模型(DM)又如何呢? 这篇来自NYU、MIT和谷歌团队新研究中,提出了一个创新性解决方案,通过设计通用搜索框架,从两个维度来提升模型性能。 论文地址:https://arxiv.org/pdf/2501.09732 一是引入验证器提供质量反馈,而是设计专门的算法寻找更优质的噪声候选。 简言之,验证器+算法,成为了打通扩散模型测试时Scaling Law的核心要素。 谢赛宁表示,「2025年 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览