文章预览
梦晨 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 来了来了!刚刚,OpenAI新模型无预警上新: o1系列 ,可以进行通用复杂推理,每次回答要花费更长时间思考。 在解决 博士水平的物理问题 时,GPT-4o还是“不及格”59.5分,o1一跃来到“优秀档”,直接干到 92.8分 ! 没错,传说中的「草莓」 ,终于来与大家见面了! CEO奥特曼称它是一种 新范式的开始 :可以进行通用复杂推理的人工智能。 具体来说,o1系列是OpenAI首个经过强化学习训练的模型, 在输出回答之前,会在产生一个很长的思维链 ,以此增强模型的能力。 换句话说,内部思维链越长,o1思考得越久,模型在推理任务上的表现就越好。 o1有多强呢?CEO奥特曼直给了答案: 在刚刚结束的 2024 IOI信息学奥赛 题目中,o1的微调版本在每题尝试50次条件下取得了213分,属于人类选手中前49%的成绩。 如果
………………………………