OpenAI 发布“草莓”模型！不卷训练卷推理了，理科能力评测达到“博士级”

硅星GenAI · 公众号 · 科技创业科技自媒体 · 2024-09-13 09:03

主要观点总结

OpenAI发布新模型o1-preview和o1-mini，专注于复杂任务推理，可解决科学、编程和数学等领域更难的问题。o1与GPT-4o的主要区别在于更擅长解决复杂问题，产生长的内部思维链，并向用户解释推理过程。o1通过强化学习技术进行训练，实现了类人“思维链”推理。新模型的出现引起了广泛关注和讨论，有人将其与Claude 3.5、replit、Cursor等以编程能力见长的AI工具进行比较。同时，OpenAI还介绍了模型开发的心路历程以及未来的计划。

关键观点总结

关键观点1: OpenAI发布的新模型o1-preview和o1-mini，专注于复杂任务推理，解决科学、编程和数学等领域的难题。

使用速度比GPT-4o慢，价格也更高；o1-mini计划对所有ChatGPT免费用户开放。目前o1-preview每周的消息限制为30条。

关键观点2: o1与GPT-4o的主要区别

o1更擅长解决复杂问题，产生长的内部思维链并向用户解释推理过程，经过训练还能优化思维过程、尝试不同策略及识别自身错误，幻觉减少。

关键观点3: o1的强化学习训练方式

不同于早期的GPT模型，o1通过强化学习技术进行训练，基于奖励和惩罚机制，通过试错过程调整决策，找到能够最大化长期回报的策略。这种学习方式类似于生物体通过经验积累来适应环境，优化行为。

关键观点4: o1的能力评估

在测试中，o1在物理、化学、生物学等具有挑战性的基准任务上表现优异，尤其是数学和编程方面。它的表现优于GPT-4o，获得更高的人类偏好度，但仍有缺陷和局限性。

关键观点5: 其他值得关注的信息

OpenAI还介绍了o1系列模型的适用人群、价格、优势与局限性，以及未来迭代计划。此外，OpenAI新模型的发布引起广泛关注和讨论，有人将其与其他AI工具进行比较，也引发了关于模型训练和应用的思考。

文章预览

作者｜ Jessica 邮箱｜ JessicaZhang@pingwest.com 传闻中的“草莓”模型终于问世！北京时间今日凌晨，OpenAI官宣发布 o1-preview ，其全新推理模型系列的首个预览版。新模型专注于复杂任务推理，能在科学、编程和数学等领域解决比以往模型更难的问题。使用速度比GPT-4o慢，价格也更高，同时发布的还有小尺寸经济版本o1-mini。以及这次不用等了：从今天起，ChatGPT Plus 和 Team 用户就可以访问 o1-preview 和 o1-mini ，企业和教育用户将在下周早些时候获得权限，而o1-mini 则计划对所有 ChatGPT免费用户开放。使用时只需在模型下拉菜单中手动选择即可。目前o1-preview 每周的消息限制为 30 条，o1-mini 为 50 条。开发者如果达到tier 5级别，也可以立即通过API 调用这两个模型，只是成本较高：o1-preview每百万输入标记15 美元，每百万输出标记 60 美元。相比之下GPT-4o 的对 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博