连接人工智能技术人才和产业人才的交流平台
今天看啥  ›  专栏  ›  机器学习研究组订阅

o1 pro挑战美国本科生最难数学竞赛,30分钟交卷却被「大佬」现场打脸!

机器学习研究组订阅  · 公众号  · AI  · 2024-12-09 19:24
    

文章预览

一年一次的北美最难本科数学竞赛,刚在MIT沃克纪念堂(Walker Memorial)落幕。 这场普特南数学竞赛(Putnam Exam),每年汇聚了来自北美数百所高校的3500多名学生前来参赛。 既有个体,也有团体,他们需要在总时长为6小时的时间内完成作答。 在这场比赛还未开始之前,来自IBM研究员曾暗示,在公开题目发布后,会有人对大模型(AlphaProof、o1、Gemini)进行题目测试。 恰好,OpenAI最近发布了满血版o1,以及最强o1 pro,不知它们在这场考试表现如何? 相较于o1-preview,o1数学性能提升27%,o1 pro提升36% o1 Pro半小时做出全部赛题 令人吃惊的是,有网友把此次普特南考试的考题给了OpenAI o1 pro。 上下滑动查看 6个小时的赛题,它居然半小时就做出来了! 用时最长的一道题花了6分52秒,最短的只用了1分12秒(上下滑动查看) 详细看了答案的网友们表示松了一口气 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览