突发！OpenAI发布最强模型o1：博士物理92.8分，IOI金牌水平

大数据与机器学习文摘 · 公众号 · 大数据 · 2024-09-13 09:00

主要观点总结

OpenAI最新模型o1系列进行通用复杂推理，表现优异。与GPT-4o相比，o1在多种科目上成绩有所提升。o1系列分为三个型号，其中o1为最新大模型，目前不方便对外公开。该系列模型通过强化学习训练，可以在推理任务上表现更好。OpenAI总裁等高管对此次发布表示高度关注。新模型在思考过程中尝试不同的策略，并认识到自己的错误。但尚不具备ChatGPT的某些功能，如联网搜索和上传文件。OpenAI正努力改进模型，并邀请相关专家试用。

关键观点总结

关键观点1: OpenAI新模型o1系列进行通用复杂推理，在解决物理问题时表现优异。

o1系列可以进行通用复杂推理，解决博士水平的物理问题。在解决这些问题时，o1系列表现出色，得到了高分数。

关键观点2: o1系列分为三个型号，各有特点。

o1系列是OpenAI首个经过强化学习训练的模型，包括o1、o1-preiview和o1-mini三种型号。o1被视为新的大模型天花板，目前不方便对外公开。o1-preiview是早期版本，可以立即提供给ChatGPT付费用户和API用户。o1-mini速度更快、性价比更高，适用于需要推理和无需广泛世界知识的任务。

关键观点3: 新模型使用强化学习训练，尝试不同的策略来完善思维过程。

与之前的模型不同，o1系列使用强化学习训练，使模型在输出回答前产生更长的思维链，增强模型的能力。这种训练方法使o1模型学会完善自己的思维过程，尝试不同的策略，并认识到自己的错误。

关键观点4: o1系列在某些任务上表现超过GPT-4o。

在2024 IOI信息学奥赛题目中，o1的微调版本在每题尝试50次条件下取得了高分。与GPT-4o相比，o1在数理化生、英语法律经济等各种科目都有成绩改进。

关键观点5: o1系列的访问权限和未来发展。

根据OpenAI官方说法，ChatGPT Plus和Team用户最早可在几个小时内体验o1系列模型。API访问权限将首先给在OpenAI API上花费超过1000美元的人。OpenAI正在努力增加模型的推理时间，旨在让未来的版本能够思考数小时、数天甚至数周。

文章预览

梦晨衡宇发自凹非寺量子位 | 公众号 QbitAI 来了来了！刚刚，OpenAI新模型无预警上新： o1系列，可以进行通用复杂推理，每次回答要花费更长时间思考。在解决博士水平的物理问题时，GPT-4o还是“不及格”59.5分，o1一跃来到“优秀档”，直接干到 92.8分！没错，传说中的「草莓」，终于来与大家见面了！ CEO奥特曼称它是一种新范式的开始：可以进行通用复杂推理的人工智能。具体来说，o1系列是OpenAI首个经过强化学习训练的模型，在输出回答之前，会在产生一个很长的思维链，以此增强模型的能力。换句话说，内部思维链越长，o1思考得越久，模型在推理任务上的表现就越好。 o1有多强呢？CEO奥特曼直给了答案：在刚刚结束的 2024 IOI信息学奥赛题目中，o1的微调版本在每题尝试50次条件下取得了213分，属于人类选手中前49%的成绩。如果 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博