主要观点总结
本文介绍了OpenAI推出的新一代推理模型o3系列的mini版本o3-mini。该模型具有成本效益高、反应速度快、准确率高、能力强等特点,并在多个测试中表现优于o1。OpenAI推出o3-mini的同时强调了这是首次向免费用户提供推理模型,并提供了不同用户级别的使用范围和价格详情。另外,本文还提到了DeepSeek发布的DeepSeek-R1模型与OpenAI的竞争情况,以及OpenAI正在采取措施维持自身优势的消息。
关键观点总结
关键观点1: OpenAI推出o3系列的mini版本o3-mini
作为新一代推理模型,o3-mini在科学、数学、编程等领域表现出色,兼具低延迟和低成本特点。
关键观点2: o3-mini的表现优于o1
在多个特定测试中,o3-mini的得分高于o1,并且在编码测试LiveBench和一般知识测试中的表现也优于o1。
关键观点3: ChatGPT首次向免费用户提供推理模型
用户可以在消息编辑器中选择“Reason”来尝试使用OpenAI 3-mini,付费用户则可以使用更高级功能。
关键观点4: DeepSeek发布的DeepSeek-R1模型与OpenAI的竞争
DeepSeek-R1模型性能对标OpenAI o1正式版,并且API价格低于o1,可能对OpenAI构成压力。
关键观点5: OpenAI采取措施维持优势
除了推出o3-mini,OpenAI还正在就新一轮融资进行谈判,拟筹资金额高达400亿美元,以维持其在人工智能领域的优势地位。
文章预览
2025.02. 01 本文字数:1108,阅读时长大约2分钟 导读 :据OpenAI介绍,ChatGPT是首次向免费用户提供推理模型。 作者 | 第一财经 郑栩彤 当地时间1月31日,OpenAI宣布推出新一代推理模型o3系列的mini版本。据OpenAI介绍,o3-mini是其最具成本效益的推理模型,在科学、数学、编程等领域的能力较强,同时兼具o1-mini的低成本和低延迟特点,o3-mini可与联网搜索功能搭配使用,不过o3-mini还不支持视觉功能。 “o3-mini的能力可设置为低等、中等、高等。能力设置为中等的o3-mini与o1在数学、编程和科学方面的表现相当,但反应速度更快。专家测试人员的评估表明,o3-mini给出的答案比o1-mini更准确且清晰。测试者观察到,在有关现实世界的难题上,o3-mini的主要错误减少了39%。”OpenAI表示。 从能力上看,作为mini版本,o3-mini在一些测试中的表现略超o1。在数学测试AIME 2024
………………………………