OpenAI发布新模型o1，是新范式的开始吗？

第一财经YiMagazine · 公众号 · 财经 · 2024-09-20 08:55

主要观点总结

本文主要介绍了OpenAI发布的新模型o1系列中的o1-preview和o1-mini模型。这两个模型在数学和编程方面展现出显著提升的推理能力，但存在速度、成本和应用范围的局限性。文章详细阐述了o1模型推理能力提高的关键在于强化学习与思维链的结合，以及它在某些任务上的局限性。同时，讨论了OpenAI在模型训练和产品化方面的挑战，包括面临的技术难题和人员流失问题。此外，文章还提到了OpenAI正在寻求新一轮融资以及未来发展的不确定性。

关键观点总结

关键观点1: o1模型在数学和编程方面的推理能力显著提升，但在其他任务上几乎没有进步。

通过强化学习和思维链技术，o1模型在处理复杂问题时的能力得到提升，但仍存在局限性。

关键观点2: o1模型的使用体验因响应速度慢和成本高昂而不友好。

由于采用思维链技术导致的推理环节增加，o1模型的响应速度变慢且成本增加。

关键观点3: OpenAI在模型训练和产品化方面面临挑战。

虽然新模型在特定任务上表现突出，但泛化能力有限。同时，OpenAI在人员流失和产品发布速度方面的放缓引发担忧。

关键观点4: OpenAI正在寻求新一轮融资以应对其庞大的开支。

尽管收入持续增长，但OpenAI的支出也在同步增长，导致它需要寻求更多融资以维持运营。

关键观点5: 大模型领域进入瓶颈期，需要新的突破和创新。

随着多家公司退出基础模型的竞争，大模型领域面临瓶颈，需要新的技术突破和创新来推动发展。

文章预览

撰文：吴一凡表格整理：吴一凡｜制图：程星编辑：王杰夫 Key Points o1模型在数学和编程方面的推理能力显著提升，但在其他任务上几乎没有进步；强化学习与思维链是o1推理能力提升的主要动力，代价是模型「思考」时间更长，算力消耗更大； o1-preview的使用价格是GPT-4o的3到4倍； o1模型意味着Scaling Law或许可以继续生效，从训练阶段转向推理阶段； OpenAI在提升模型能力与产品化的速度上都在放缓。 9月13日，OpenAI发布了两款大语言模型o1-preview和o1-mini，也就是此前备受关注的「草莓」模型。 OpenAI科学家Hyung Won Chung用「单词Strawberry里有几个字母r？」这个问题来展示o1模型的推理能力。 OpenAI放弃了此前GPT系列的命名方法，对此它给出了这样的解释，「对于复杂的推理任务来说，这是一个重大的进步，代表了AI能力的一个新的水平。因此，我们将计 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博