OpenAI发布o3，更强也更贵了，仨月更新一代只为证明AGI还有戏

硅星人Pro · 公众号 · 科技媒体 · 2024-12-21 09:25

主要观点总结

OpenAI在“12 Days of OpenAI”活动的最后一天发布了最新的推理模型o3和它的高效版本o3 mini。这两款模型在性能上实现了重大突破，能够处理日益复杂的推理任务，标志着AI技术迈入了一个全新阶段。o3在多项基准测试中表现卓越，特别是在编程和数学领域。o3 mini则针对需要在性能与成本之间取得平衡的应用场景而推出，提供了低、中、高三种推理强度选项，让用户能根据任务复杂度灵活调整模型的思考时间。此外，OpenAI还展示了其全新的深度对齐技术，该技术在安全性评估中表现卓越。同时，OpenAI的华人研究员也崭露头角，在模型训练中发挥着重要作用。此次发布引发了关于OpenAI是否要放弃GPT、全力投入o系列的猜测。

关键观点总结

关键观点1: o3和o3 mini的发布

o3和o3 mini是OpenAI的最新推理模型，这两款模型在性能上实现了重大突破，能够处理日益复杂的推理任务。o3在编程和数学等领域表现卓越，而o3 mini则为用户提供了灵活的推理强度选项，满足了不同应用场景的需求。

关键观点2: 深度对齐技术的引入

OpenAI引入了全新的深度对齐技术，该技术通过推理用户的输入意图，大幅提升了模型对潜在不安全请求的识别能力。这一技术在安全性评估中表现卓越，为用户提供了更高的安全保障。

关键观点3: 华人研究员的崛起

在o3 mini的官宣过程中，出现了几位华人研究员的面孔，他们在模型训练中发挥着重要作用。这些研究员的才华和努力为OpenAI的发展做出了贡献。

关键观点4: OpenAI的战略转向

从近期的发布来看，OpenAI正在经历一次重大的战略转向，从传统GPT大语言模型转向推理模型。这一转变可能是为了寻找突破当前技术瓶颈的关键，并实现更高水平的智能。

文章预览

作者｜ Jessica 邮箱｜ JessicaZhang@pingwest.com 今天是“12 Days of OpenAI”活动的最后一天。无论从前几天发布节奏还是时间点来看，都到了必须拿出真家伙的时候。果然，正如Sam Altman“oh oh oh”哑谜暗示的那样，OpenAI终于官宣了推理模型系列的最新旗舰成员： o3 和 o3 mini 。团队称，这两款模型在性能上实现了重大突破。能够处理日益复杂的推理任务，标志着”AI技术迈入了一个全新阶段。” 有意思的是，作为 o1 的下一代模型，OpenAI 在命名时越过“o2”，直接跳到了o3。以此防止与英国电信运营商O2的商标冲突，避开潜在的法律纠纷。 1 o3模型：推理性能飙升，多项超人类专家作为OpenAI当前性能最强的推理模型， o3在多项基准测试中表现卓越，特别是编程和数学领域显著提升。 • 编程能力：在真实世界软件任务评估（HumanEval-Verified）中，o3以 71.7% 的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博