今天看啥  ›  专栏  ›  调研纪要

“草莓”现真身

调研纪要  · 公众号  ·  · 2024-09-13 14:04

文章预览

9月13日,OpenAl宣布其最新的模型OpenAl o1 ( 内部代号“草莓大模型”) 正式发布, 主打推理能力,号称能解决比以往模型更难的科学、编程和数学问题。 - 推理能力大: OpenAI 表示,o1 模型在物理、化学和生物等学科的 challenging 基准测试中,表现与博士生相当 - 数学和编程能力:  在一项国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4o 的正确率只有 13%,而 o1 模型的正确率高达 83%!在 Codeforces 编程竞赛中,o1 模型的成绩也达到了前 89%! 之前的市场预期: 发布时间基本符合预期 : 技术关键点:RL & CoT & 慢思考换取推理能力【大幅】提升 【为什么提高?Scaling Law新范式,从预训练向后训练和推理转移】 o1经过强化学习训练来执行复杂的推理,并在回答之前产生一个很长的内部思维链(CoT)。强化学习(RL)+ 思维链(CoT)在高度数据高效的训 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览