分享大数据技术相关文章和资源
今天看啥  ›  专栏  ›  大数据与机器学习文摘

突发!OpenAI发布最强模型o1:博士物理92.8分,IOI金牌水平

大数据与机器学习文摘  · 公众号  · 大数据  · 2024-09-13 09:00

主要观点总结

OpenAI最新模型o1系列进行通用复杂推理,表现优异。与GPT-4o相比,o1在多种科目上成绩有所提升。o1系列分为三个型号,其中o1为最新大模型,目前不方便对外公开。该系列模型通过强化学习训练,可以在推理任务上表现更好。OpenAI总裁等高管对此次发布表示高度关注。新模型在思考过程中尝试不同的策略,并认识到自己的错误。但尚不具备ChatGPT的某些功能,如联网搜索和上传文件。OpenAI正努力改进模型,并邀请相关专家试用。

关键观点总结

关键观点1: OpenAI新模型o1系列进行通用复杂推理,在解决物理问题时表现优异。

o1系列可以进行通用复杂推理,解决博士水平的物理问题。在解决这些问题时,o1系列表现出色,得到了高分数。

关键观点2: o1系列分为三个型号,各有特点。

o1系列是OpenAI首个经过强化学习训练的模型,包括o1、o1-preiview和o1-mini三种型号。o1被视为新的大模型天花板,目前不方便对外公开。o1-preiview是早期版本,可以立即提供给ChatGPT付费用户和API用户。o1-mini速度更快、性价比更高,适用于需要推理和无需广泛世界知识的任务。

关键观点3: 新模型使用强化学习训练,尝试不同的策略来完善思维过程。

与之前的模型不同,o1系列使用强化学习训练,使模型在输出回答前产生更长的思维链,增强模型的能力。这种训练方法使o1模型学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。

关键观点4: o1系列在某些任务上表现超过GPT-4o。

在2024 IOI信息学奥赛题目中,o1的微调版本在每题尝试50次条件下取得了高分。与GPT-4o相比,o1在数理化生、英语法律经济等各种科目都有成绩改进。

关键观点5: o1系列的访问权限和未来发展。

根据OpenAI官方说法,ChatGPT Plus和Team用户最早可在几个小时内体验o1系列模型。API访问权限将首先给在OpenAI API上花费超过1000美元的人。OpenAI正在努力增加模型的推理时间,旨在让未来的版本能够思考数小时、数天甚至数周。


文章预览

梦晨 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 来了来了!刚刚,OpenAI新模型无预警上新: o1系列 ,可以进行通用复杂推理,每次回答要花费更长时间思考。 在解决 博士水平的物理问题 时,GPT-4o还是“不及格”59.5分,o1一跃来到“优秀档”,直接干到 92.8分 ! 没错,传说中的「草莓」 ,终于来与大家见面了! CEO奥特曼称它是一种 新范式的开始 :可以进行通用复杂推理的人工智能。 具体来说,o1系列是OpenAI首个经过强化学习训练的模型, 在输出回答之前,会在产生一个很长的思维链 ,以此增强模型的能力。 换句话说,内部思维链越长,o1思考得越久,模型在推理任务上的表现就越好。 o1有多强呢?CEO奥特曼直给了答案: 在刚刚结束的 2024 IOI信息学奥赛 题目中,o1的微调版本在每题尝试50次条件下取得了213分,属于人类选手中前49%的成绩。 如果 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览