文章预览
今天给大家带来一篇博杰兄(@知乎 李博杰)关于o3 模型 思考的文章,如何看待 OpenAI 最新发布的 o3 模型? 知乎:https://www.zhihu.com/question/7416922570/answer/60763494897 o1 刚出来的时候,很多人还质疑这还达不到 AGI(通用人工智能)。o3 体现出的编程和数学能力,不仅达到了 AGI 的门槛,甚至摸到了 ASI(超级人工智能)的边。 o3 也进一步验证了 RL 和 test-time scaling 的价值,在高质量预训练数据基本耗尽,模型能力 “撞墙” 的情况下,提供了一条通过后训练和增加推理时间,继续提升模型智力,解决更困难问题的路径。 o3 具体的性能指标很多人都看到了,我就不再重复了。省流版: o3 在 Codeforces 编程竞技中击败了 99.9% 的程序员,在 168076 名程序员中排名 175 名。甚至 o3 的作者都打不过 o3。 o3 在编程解决真实世界需求方面也比 o1 有明显提升,在 SWE-Bench
………………………………