专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

AI自我纠错，Diffusion超越自回归！质量提升55%，已达理论证据下界

新智元 · 公众号 · AI · 2025-03-23 12:52

文章预览

新智元报道编辑：KingHZ 【新智元导读】 Diffusion模型，学会了自我纠正！无需强化学习等后训练，扩散在语言建模中实现了自我纠错，达到了计算效率匹配的最优性能，找到了证据下界（ELBO）的理论上的闭式解，在实验中将样本质量最高提升了55%。如果大语言模型（LLMs）能够发现并纠正自己的错误，那岂不是很好？而且，如果能够直接从预训练中实现这一点，而无需任何监督微调（SFT）或强化学习（RL），那会怎样呢？最新提出的离散扩散模型，称为GIDD，它能够做到这一点。在语言建模中，GIDD实现了计算效率匹配的最优性能！请注意：不是基于自回归的LLM，是扩散语言模型。无条件生成与自我纠错算法的比较来自苏黎世联邦理工学院ETH Zurich等组织的研究团队，推广了掩码扩散（masked diffusion），并推导出一系列广义插值离散扩散模型 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宝玉xp · 将人像变成可爱 3D 微缩立体模型工具：Sora.com 或 G-20250405030626

22 小时前

爱可可-爱生活 · 【[49星]DeepResearcher：通过强化学习在真实世界-20250404174000

昨天

宝玉xp · 回复@安澜堂懒猫:Canva 得自己有点美术功底，得找图标，得选-20250404105721

昨天

量子位 · 2个百度T11推出超级智能体火爆硅谷！免费使用无需邀请码，靠AI搜索功底估值已破38亿

2 天前

爱可可-爱生活 · 【[162星]open-webui/mcpo：一个简单、安全的M-20250402132455

3 天前

保马 · 【纪念李政道先生】李中清｜父亲与现代中国科学的发展

7 月前

保马 · 【纪念李政道先生】李中清｜父亲与现代中国科学的发展

7 月前

科研大匠 · 西安交大重磅Nature：研究成果或对领域产生颠覆性影响！

7 月前

GameLook · 乐元素在Steam和Switch开户，今日发售了一款跨平台单机游戏！

4 月前

电商派Pro · 钟睒睒公开喊话：我看不起直播带货的企业家

4 月前