o1不是唯一路径！MIT新研究：在测试时训练，模型推理能力最高升至5.8倍

量子位 · 公众号 · AI · 2024-11-12 12:12

文章预览

克雷西发自凹非寺量子位 | 公众号 QbitAI o1不是通向大模型推理的唯一路径！ MIT的新研究发现，在测试时对大模型进行训练，可以让推理水平大幅提升。在挑战超难的ARC任务时，准确率最高可提升至原来的5.83倍。这样的表现不仅优于GPT-4和Claude，如果与其他推理方法相结合，还能超越人类的平均水准。 OpenAI o1团队成员 Noam Brown 表示，o1的大规模计算可能不是最好的方法，很高兴看到有学者在提高推理能力上探索新的方法。在测试中训练模型不同于传统的先训练后测试模式，测试时训练（Test-Time Training，TTT）在部署阶段面对新的测试样本时，不直接用训练好的模型去推理。在推理之前，测试样本自身携带的信息，会通过快速的训练过程被用于调整模型参数。总体来说，TTT过程中一共有三个关键阶段—— 训练数据生成、模型适应范式设计 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

宝玉xp · v0 提示词解析说明今天破解了 v0 的提示词网页链接，并且-20241123115707

2 天前

赛博禅心 · 来自 OpenAI 活动的随记

3 天前

赛博禅心 · 来自 OpenAI 活动的随记

3 天前

爱可可-爱生活 · 【spaCy Layout：一款能够处理PDF、Word文档等多-20241119140525

6 天前

爱可可-爱生活 · 【Sequin：一款帮助你调试命令行界面和文本用户界面的小工具，-20241119140651

6 天前

爱可可-爱生活 · 今日推介(第1594期)：1000名个体的生成式智能体仿真、非平-20241119061244

6 天前

BlueNote爵士乐俱乐部 · 8月底重磅推荐！萨克斯手 Vincent Herring & Eric Alexander 来自纽约的巅峰对决！

3 月前

严道医声网 · JACC｜一项DAPA-HF和DELIVER的荟萃分析，心衰患者出院后早期使用达格列净，可降低再次住院率和死亡风险！

2 月前