今天看啥  ›  专栏  ›  机器之心

刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限

机器之心  · 公众号  · AI  · 2024-09-13 04:00

主要观点总结

OpenAI发布了名为o1的新大模型系列,旨在专门解决难题。该系列模型通过强化学习训练,具备更强的推理能力,可以在解决复杂问题时产生更长的内部思维链。o1模型在多个基准测试中表现出色,如数学、编程和学术推理等方面。同时,OpenAI还发布了o1的mini版,旨在提供更高效、更便宜的解决方案。这两个模型都在推理能力上实现了显著的提升,并受到开发者的高度评价。

关键观点总结

关键观点1: OpenAI发布o1大模型系列

OpenAI发布了一系列新的大模型,旨在专门解决难题,通过强化学习训练,具备更强的推理能力。

关键观点2: o1模型的强大性能

o1模型在多个基准测试中表现出色,如数学、编程和学术推理等方面。它在解决复杂问题时可以产生更长的内部思维链,具备真正的通用推理能力。

关键观点3: OpenAI o1-mini的发布

为了提供更高效、更便宜的解决方案,OpenAI发布了o1的mini版,即o1-mini。这个较小的模型在预训练期间针对STEM推理进行了优化,并在许多有用的推理任务上实现了与o1相媲美的性能,同时成本效率显著提高。

关键观点4: 人类偏好评估

在多个领域的具有挑战性的开放式提示上,人类训练者对o1-preview和o1-mini的提示进行匿名回答,并投票选出他们更喜欢的回答。结果显示,在推理密集型领域,o1-mini比GPT-4o更受欢迎。

关键观点5: 如何使用OpenAI o1

ChatGPT Plus和Team(个人付费版与团队版)用户可以在ChatGPT中开始使用o1模型。企业版和教育版用户需要等到下周才能使用这两个模型。API用户需要达到特定使用量才能访问这些模型。


文章预览

机器之心报道 机器之心编辑部 大模型领域的技术发展,今天起再次「从 1 开始」了。 大语言模型还能向上突破,OpenAI 再次证明了自己的实力。 北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。 OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览版 ——o1-preview。除了 o1,OpenAI 还展示了目前正在开发的下次更新的评估。 o1 模型一举创造了很多历史记录。 首先,o1 就是此前 OpenAI 从山姆・奥特曼到科学家们一直在「高调宣传」的草莓大模型。它拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览