专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

o3数学成绩作弊大瓜!提前让测试机构给真题,60多名数学大牛全被蒙在鼓里

量子位  · 公众号  · AI  · 2025-01-20 13:04
    

文章预览

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI OpenAI o3还没上线,就被曝数学成绩是靠作弊得来?! Benchmark发布机构内部人员爆料称, OpenAI给了他们经费赞助 。 就连包括陶哲轩在内参与出题的60余名数学家,在消息曝光之前也都 和普通公众一样蒙在鼓里 。 直到o3发布,这一消息才被公开 。这意味着严格保密的题目,OpenAI提前拿到了手中。 这套数据集名叫 FrontierMath ,包含了由陶哲轩等60多名权威数学家命制的高难度题目。 陶哲轩就表示,这些题目足够困扰AI几年的时间;1998年菲尔斯奖得主Gowers也说,能解决其中的一个问题就已经超越现在的能力范围了。 当时也正是因为在这一测试基准上大幅领先,o3的能力更进一步被得到认可。 Epoch.ai这边,联合创始人Tamay Besiroglu也回应并 承认了秘密赞助和OpenAI提前拿到题目的传闻,但否认题目被OpenAI拿来作弊 。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览