o1不是唯一路径！MIT新研究：在测试时训练，模型推理能力最高升至5.8倍

机器学习算法与自然语言处理 · 公众号 · · 2024-11-14 00:00

文章预览

MLNLP 社区是国内外知名的机器学习与自然语言处理社区，受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。社区的愿景是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进步，特别是初学者同学们的进步。转载自 | 量子位作者 | 克雷西 o1不是通向大模型推理的唯一路径！ MIT的新研究发现，在测试时对大模型进行训练，可以让推理水平大幅提升。在挑战超难的ARC任务时，准确率最高可提升至原来的5.83倍。这样的表现不仅优于GPT-4和Claude，如果与其他推理方法相结合，还能超越人类的平均水准。 OpenAI o1团队成员Noam Brown表示，o1的大规模计算可能不是最好的方法，很高兴看到有学者在提高推理能力上探索新的方法。在测试中训练模型不同于传统的先训练后测试模式，测试时训练（Test-Time Training，TTT）在部署 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

山东省交通运输厅 · 交通要闻速览（2025年3月31日—4月4日）

7 小时前

鲁中晨报 · 冲上热搜！微信又上新功能

昨天

鲁中晨报 · 刚刚，山东省纪委监委通报！

昨天

科技美学 · 三星Galaxy S25 Ultra影像规格曝光，多处细节升级

10 月前

羊羊的地理教室 · 【每日一练】锡拉岛（Day 1002）

9 月前

羊羊的地理教室 · 【每日一练】锡拉岛（Day 1002）

9 月前

催化进展 · 张涛院士ACS Catalysis：CuOx纳米片定位在二氧化钛的路易斯酸位点上，利用分子氧进行丙烯环氧化电池中硫转化动力学

9 月前

催化进展 · 张涛院士ACS Catalysis：CuOx纳米片定位在二氧化钛的路易斯酸位点上，利用分子氧进行丙烯环氧化电池中硫转化动力学

9 月前