专栏名称: NLP工作站

AIGC前沿知识分享&落地经验总结

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

TGB湖南人 · 【2.28复盘】一根大阴线，半个月白干，亏钱 ... · 10 小时前

西藏生态环境保护 · 汪晓冬同志督导藏历新年期间厅系统值班安全廉洁工作 · 11 小时前

西藏发布 · 班禅额尔德尼·确吉杰布藏历木蛇年新年祝福 · 15 小时前

TGB湖南人 · 【2.27复盘】AI科技分歧继续，蜜雪冰城趁 ... · 昨天

网信西藏 · 藏历新年期间，免费！ · 昨天

今天看啥 › 专栏 › NLP工作站

对OpenAI o3模型的看法、思考与反思

NLP工作站 · 公众号 · · 2024-12-22 10:10

文章预览

今天给大家带来一篇博杰兄（@知乎李博杰）关于o3 模型思考的文章，如何看待 OpenAI 最新发布的 o3 模型？知乎：https://www.zhihu.com/question/7416922570/answer/60763494897 o1 刚出来的时候，很多人还质疑这还达不到 AGI（通用人工智能）。o3 体现出的编程和数学能力，不仅达到了 AGI 的门槛，甚至摸到了 ASI（超级人工智能）的边。 o3 也进一步验证了 RL 和 test-time scaling 的价值，在高质量预训练数据基本耗尽，模型能力 “撞墙” 的情况下，提供了一条通过后训练和增加推理时间，继续提升模型智力，解决更困难问题的路径。 o3 具体的性能指标很多人都看到了，我就不再重复了。省流版： o3 在 Codeforces 编程竞技中击败了 99.9% 的程序员，在 168076 名程序员中排名 175 名。甚至 o3 的作者都打不过 o3。 o3 在编程解决真实世界需求方面也比 o1 有明显提升，在 SWE-Bench ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博