今天看啥  ›  专栏  ›  深度学习与NLP

首届AI奥数竞赛方案公布:4支获奖队伍,竟都选择国产模型DeepSeekMath

深度学习与NLP  · 知乎专栏  ·  · 2024-07-12 10:52

文章预览

2014几天前,随着榜单的公布,大家对全球首届 AI 数学奥林匹克竞赛(AIMO)进步奖 的讨论量居高不下。这次比赛共有 5 个团队胜出,获得第一名的是 Numina 的团队,CMU_MATH 位列第二,after exams 暂居第三,codeinter、Conor #2 团队分别拿到第四、第五的成绩。 图源: https://www. kaggle.com/c/ai-mathema tical-olympiad-prize/leaderboard 这一成绩,曾让陶哲轩感到惊讶。 当时官方只公布了获奖名单,并未透漏背后模型的更多信息。大家都在好奇,获得冠军的队伍到底是用了哪种模型?刚刚,AIMO 进步奖公布了前四名背后模型。冠军团队用到的模型是 NuminaMath 7B TIR,该模型是 deepseek-math-7b-base 的微调版本。 获得第二名的队伍微调了两个 DeepSeek-Math-7B-RL 模型,一个用作策略模型(用于生成解决方案),一个用作奖励模型(用于对加权多数投票的解决方案进行评分)。 第三名 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览