最高138.7分！国产大模型「考研数学」成绩单出炉，哪家AI能上岸？

人工智能学家 · 公众号 · AI · 2025-01-16 17:45

文章预览

来源：学术头条整理：学术君高考、考研数学，旨在考察学生的逻辑推理素养，每年都会难倒一大片准备上岸的学子。那么，对于被训练成「像人类一样思考」的人工智能（AI）系统，尤其是近期讨论颇多的 o1 类推理模型而言，「数学」这门考试到底难不难呢？更进一步说，如果同时参加 2025 考研的数学考试，国内头部推理模型与 OpenAI o1 的差距又有多大呢？日前，来自清华大学人工智能研究院基础模型研究中心的团队，便晒出了国内外 13 个模型（基础模型、深度推理模型）在 2025 年考研数学（一、二、三）上交出的答卷—— 直白一点说： o1 最强，但对国产头部模型（如 GLM-zero-preview、QwQ）的领先优势不大。具体而言，这些推理模型的 2025 考研数学成绩全部达到了 120+，最强模型 OpenAI o1 的分数达到了惊人的 141.3 分（平均），在总计 66 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 《爱可可微博热门分享(1.21)》爱可可微博热门分享(1.2-20250121224707

13 小时前

黄建同学 · 免费的编程、计算机和AI电子书大集合🔥🔥🔥34.5K⭐访问-20250120192043

昨天

爱可可-爱生活 · 【[347星]InkyPi：一款基于树莓派的电子墨水屏显示项目，-20250120184401

昨天

量化投资与机器学习 · 2024年全球『最赚钱』的对冲基金管理人出炉！

昨天

宝玉xp · 回复@地才卷大葱:👍//@地才卷大葱:Build a Larg-20250119230449

2 天前

邱震海 · 【倾听彼得·邱】中国与西方关系走向及其趋势

7 月前