专栏名称: 钛媒体
最新鲜犀利的商业见闻,最国际视野的前沿技术,最不常见的独家猛料。钛媒体(www.tmtpost.com),网罗天下创新事,一个创新者最爱聚集的地方。
今天看啥  ›  专栏  ›  钛媒体

OpenAI发布最强推理模型o1:可解答83%的奥数问题|钛媒体AGI

钛媒体  · 公众号  · 科技媒体  · 2024-09-13 21:09
    

主要观点总结

OpenAI公司发布全新模型技术产品o1,包括o1-preview和o1-mini两个版本。新模型在推理数学、编程、科学等方面的能力显著提高,性能接近理化生博士水平。OpenAI CEO表示,这是迄今为止功能最强大、最一致的模型系列,预示着AI时代崭新的起点。o1模型具备独立解决问题的能力,通过强化学习使用奖励和惩罚机制来“教育”AI使用“思维链”处理问题。o1的推出使ChatGPT能够在回答问题前先仔细思考,进化到了可使用系统 2 思维(缓慢、深思熟虑、有意识、可靠)。根据测试,o1性能持续提高,并在某些基准测试中超越了人类专家。此外,OpenAI还在商谈新一轮融资,以支持公司的发展。

关键观点总结

关键观点1: OpenAI发布全新模型技术产品o1,包括o1-preview和o1-mini两个版本。

o1模型旨在解决通用复杂推理任务,性能显著提高。OpenAI CEO将其评价为迄今为止功能最强大、最一致的模型系列。

关键观点2: o1模型具备独立解决问题的能力。

通过强化学习,o1模型使用奖励和惩罚机制来“教育”AI使用“思维链”处理问题。这使其能够解决以前无法解决的问题。

关键观点3: o1模型在基准测试中表现优异。

在国际数学奥林匹克和编程能力比赛Codeforces中,o1模型表现出色,正确解答了高百分比的问题。OpenAI技术文件称,o1模型性能接近理科博士水平。

关键观点4: OpenAI正在商谈新一轮融资以支持公司发展。

融资将用于支持公司的计算能力和其他运营费用需求。此外,OpenAI首席财务官强调了员工在收购要约中的股份出售计划。


文章预览

▎ “这是我们迄今为止功能最强大、最一致的模型系列o1,也是迄今为止我们最好的推理模型。虽然o1仍然存在缺陷并有限,但使用时的感觉依然更加令人印象深刻。”OpenAI CEO表示。 作者|林志佳 编辑|胡润峰 本文首发于钛媒体APP 北京时间9月13日凌晨,美国OpenAI公司发布全新模型技术产品o1,包括两种版本o1-preview 和 o1-mini,前者具有高级推理功能,在推理数学、编程、科学等问题的能力上有显著提高,性能接近理化生博士水平;后者则是一款更小巧、专为代码生成优化的模型。 这就是此前传言中高级推理能力强大模型的“Strawberry”项目。也有人分析称,o1是Orion大模型简称。 OpenAI表示,对于复杂推理任务而言,新模型代表着 AI 能力的崭新水平,因此值得将计数重置为1,给它一个有别于“GPT-4”系列的全新名号。同时,这也预示着,AI时代迎来 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览