又一个国产o1来了，直接数学竞赛题伺候！

量子位 · 公众号 · AI · 2024-11-27 13:00

主要观点总结

文章介绍了昆仑万维的Skywork o1模型在多种推理任务上的表现，包括数学、脑筋急转弯、加密问题等。文章还详细阐述了Skywork o1模型的三阶段自研技术方案，包括推理反思能力训练、推理能力强化学习和推理规划。此外，文章还讨论了类o1模型的重要性，以及昆仑万维在大模型时代的技术布局和开源策略。

关键观点总结

关键观点1: Skywork o1模型在多种推理任务上表现出色，包括数学、脑筋急转弯、加密问题等。

Skywork o1模型通过分解问题、建立方程组、代数求解等方法解决数学问题。在脑筋急转弯任务中，模型能够按照人类思考过程进行逻辑分析。在加密问题中，模型通过归纳字符映射关系，基于映射规则解码密文。此外，Skywork o1模型还具备自我反思和验证的能力，能够优化推理过程。

关键观点2: Skywork o1模型采用三阶段自研技术方案，包括推理反思能力训练、推理能力强化学习和推理规划。

在第一阶段，模型通过高质量的分步思考、反思和验证数据进行推理反思能力训练。在第二阶段，模型采用推理能力强化学习，通过自研的Skywork o1 Process Reward Model（PRM）和分步推理强化算法提升推理能力。在第三阶段，模型应用Q*算法进行在线推理，寻找最佳推理路径。

关键观点3: 类o1模型的重要性及昆仑万维的技术布局和开源策略。

类o1模型具备通用复杂推理能力，适应市场需求，满足科学研究、编程、数据分析等领域的性能要求。昆仑万维在大模型时代表现出色，推出了一系列大模型和AI应用。同时，昆仑万维注重开源策略，通过开源模型加速国内开源社区复现o1的进程。Skywork o1模型的开源版本Skywork o1 Open也体现了昆仑万维的开放和共享精神。

文章预览

金磊发自凹非寺量子位 | 公众号 QbitAI 家人们，国产o1大模型，最近着实是有点火啊。就在今天，昆仑万维的 Skywork o1 也开启了邀测。那一波实测，这不就得安排一下么。类似o1模型最大的特点就是其强悍的推理能力，因此，我们直接上一道 AIME数学竞赛题，看看够不够“开门”。（AIME：美国数学邀请赛，是介于AMC10、AMC12及美国数学奥林匹克竞赛之间的一个数学竞赛。）题目翻译过来是这样的：每天早晨，Aya会进行一段长度为9公里的散步，然后在一家咖啡店停留。当她以每小时s公里的恒定速度行走时，整个散步加上在咖啡店停留的时间一共需要4小时，其中包含在咖啡店停留的t分钟。当她以s+2公里每小时的速度行走时，整个过程（包括在咖啡店停留的时间）需要2小时24分钟。假设Aya以s+1/2公里每小时的速度行走，求她在这种情况下（包 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博