OpenAI Jason wei解读o1:思维链的“顿悟时刻”,大模型不再鹦鹉学舌

人工智能学家 · 公众号 · AI · 2024-11-10 17:23

文章预览

来源：AI寒武纪 OpenAI的研究员Jason Wei（o1思维链核心开发人员）点出了一个关键但容易被忽视的问题：思维链在o1出现前后发生了巨大的变化，虽然只是名称上多了个"o1"，但这背后的含义却远不止如此 o1之前：模仿秀，不是真思考在o1范式出现之前（即思维链提示的早期阶段），思维链的实际运作方式与我们期望的之间存在着很大的差异。我们希望思维链能够反映模型真正的思考过程，但实际上，模型只是在模仿它在预训练数据中看到的推理路径，例如数学作业的解答。这类数据的最大问题在于，它们是事后诸葛亮式的总结，作者在其他地方完成了所有思考过程后才写下的答案，而不是真正的思维过程记录。因此，这些答案的信息密度往往很低，一个极端的例子就是“答案是5，因为……”，其中“5”这个词承载了几乎所有的新信息量，而前面的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

DataFunTalk · AI搜索在快消领域的最佳实践

3 天前

DataFunTalk · AI搜索在快消领域的最佳实践

3 天前

Founder Park · 对话王诗沐：走出大厂创业，做 3D AI 游戏，瞄准新的内容平台机会

4 天前

Founder Park · 对话王诗沐：走出大厂创业，做 3D AI 游戏，瞄准新的内容平台机会

4 天前

爱可可-爱生活 · [CL]《Benchmarking Distributional-20241117072225

5 天前

宝玉xp · 回复@一果阿:主要是这例子AI写不出来吧//@一果阿:干货满满然-20241117011843

5 天前

爱可可-爱生活 · 【Promptim 提示优化器：用于优化 AI 系统提示（pro-20241115213247

1 周前

Dance with GenAI · 解锁你的创意潜能：《AI绘画师：文案、图片与视频制作从入门到精通》

4 月前

今日保 · 保险理赔难咋来的：险企冤不冤？怎么化解？丨燕梳夜谭㊵

3 月前

三星医学科学 · 精彩议题呈现，欢迎莅临见证｜(2024)国际妇产超声学会中国大会

1 月前