今天看啥  ›  专栏  ›  机器之心

OpenAI o1智商120,还是被陶哲轩称为「平庸的研究生」,但实力究竟如何?

机器之心  · 公众号  · AI  · 2024-09-16 13:16

文章预览

机器之心报道 编辑:蛋酱、杨文 o1消息满天飞。 自从 OpenAI 发布了新模型 o1 后,它就承包了 AI 领域近几天的热搜: 有人用门萨智商测试题「拷问」它,竟测得 o1 智商高达 120; 数学大佬陶哲轩要求 o1 回答一个措辞含糊的数学问题,最终得出一个结论:o1 是个平庸但不无能的研究生; 还有一位天体物理学论文作者,仅用 6 次 Prompt,就让 o1 系列模型在 1 小时内,创建了代码运行版本,这可是他博士生期间 10 个月的工作量。 但在 ARC Prize 测试中,o1 的表现并没有想象中出类拔萃,仅仅是追平几个月前发布的 Claude 3.5 Sonnet。 看完五花八门的评测,大家反而有些迷茫了,o1 的实力到底怎么样? 智商测试得分忽高忽低,网友纷纷质疑 上周,OpenAI 在介绍 o1 时表示,它不需要专门训练,就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览