文章预览
撰文:吴一凡 表格整理:吴一凡|制图:程星 编辑:王杰夫 Key Points o1模型在数学和编程方面的推理能力显著提升,但在其他任务上几乎没有进步; 强化学习与思维链是o1推理能力提升的主要动力,代价是模型「思考」时间更长,算力消耗更大; o1-preview的使用价格是GPT-4o的3到4倍; o1模型意味着Scaling Law或许可以继续生效,从训练阶段转向推理阶段; OpenAI在提升模型能力与产品化的速度上都在放缓。 今天凌晨,OpenAI发布了两款大语言模型o1-preview和o1-mini,也就是此前备受关注的「草莓」模型。 OpenAI科学家Hyung Won Chung用「单词Strawberry里有几个字母r?」这个问题来展示o1模型的推理能力。 OpenAI放弃了此 前GPT系列的命名方法, 对此它给出了这样的解释,「对于复杂的推理任务来说,这是一个重大的进步,代表了AI能力的一个新的水平。因此,我们将
………………………………