今天看啥  ›  专栏  ›  硅星GenAI

OpenAI 发布“草莓”模型!不卷训练卷推理了,理科能力评测达到“博士级”

硅星GenAI  · 公众号  · 科技创业 科技自媒体  · 2024-09-13 09:03

主要观点总结

OpenAI发布新模型o1-preview和o1-mini,专注于复杂任务推理,可解决科学、编程和数学等领域更难的问题。o1与GPT-4o的主要区别在于更擅长解决复杂问题,产生长的内部思维链,并向用户解释推理过程。o1通过强化学习技术进行训练,实现了类人“思维链”推理。新模型的出现引起了广泛关注和讨论,有人将其与Claude 3.5、replit、Cursor等以编程能力见长的AI工具进行比较。同时,OpenAI还介绍了模型开发的心路历程以及未来的计划。

关键观点总结

关键观点1: OpenAI发布的新模型o1-preview和o1-mini,专注于复杂任务推理,解决科学、编程和数学等领域的难题。

使用速度比GPT-4o慢,价格也更高;o1-mini计划对所有ChatGPT免费用户开放。目前o1-preview每周的消息限制为30条。

关键观点2: o1与GPT-4o的主要区别

o1更擅长解决复杂问题,产生长的内部思维链并向用户解释推理过程,经过训练还能优化思维过程、尝试不同策略及识别自身错误,幻觉减少。

关键观点3: o1的强化学习训练方式

不同于早期的GPT模型,o1通过强化学习技术进行训练,基于奖励和惩罚机制,通过试错过程调整决策,找到能够最大化长期回报的策略。这种学习方式类似于生物体通过经验积累来适应环境,优化行为。

关键观点4: o1的能力评估

在测试中,o1在物理、化学、生物学等具有挑战性的基准任务上表现优异,尤其是数学和编程方面。它的表现优于GPT-4o,获得更高的人类偏好度,但仍有缺陷和局限性。

关键观点5: 其他值得关注的信息

OpenAI还介绍了o1系列模型的适用人群、价格、优势与局限性,以及未来迭代计划。此外,OpenAI新模型的发布引起广泛关注和讨论,有人将其与其他AI工具进行比较,也引发了关于模型训练和应用的思考。


文章预览

作者 | Jessica 邮箱 | JessicaZhang@pingwest.com 传闻中的“草莓”模型终于问世! 北京时间今日凌晨,OpenAI官宣发布 o1-preview ,其全新推理模型系列的首个预览版。 新模型专注于复杂任务推理,能在科学、编程和数学等领域解决比以往模型更难的问题。使用速度比GPT-4o慢,价格也更高,同时发布的还有小尺寸经济版本o1-mini。 以及这次不用等了: 从今天起,ChatGPT Plus 和 Team 用户就可以访问 o1-preview 和 o1-mini ,企业和教育用户将在下周早些时候获得权限,而o1-mini 则计划对所有 ChatGPT免费用户开放。 使用时只需在模型下拉菜单中手动选择即可。目前o1-preview 每周的消息限制为 30 条,o1-mini 为 50 条。 开发者如果达到tier 5级别,也可以立即通过API 调用这两个模型,只是成本较高:o1-preview每百万输入标记15 美元,每百万输出标记 60 美元。相比之下GPT-4o 的对 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览