o3权威评测报告：AI能力实现关键跃升，但仍未达到AGI水平

腾讯科技 · 公众号 · 科技媒体 · 2024-12-21 10:34

文章预览

12月21日消息，OpenAI发布最新一代推理模型o3的同一天，知名法国计算机科学家和机器学习研究者、ARC Prize基金会的创始人弗朗索瓦·肖莱（François Chollet）撰写报告称，o3在ARC-AGI基准测试中取得了突破性高分。ARC-AGI是一个专门设计用来测试人工智能模型对极其困难的数学和逻辑问题进行推理的能力的基准测试。肖莱在报告中指出，OpenAI最新推出的o3模型，在基于ARC-AGI-1公共训练集的训练下，在遵守公开排行榜规定的1万美元计算限制（compute limit）的前提下，在半私有评估集上取得了75.7%的突破性高分。而在高计算量（172倍）配置下的o3模型，得分更是达到了87.5%。这一成绩标志着人工智能能力出现了令人震惊且关键的跃升，展现出GPT系列模型中前所未有的新任务适应能力。举例来说，在ARC-AGI-1的测试中，得分从2020年GPT-3的0%增长到2024年GPT-4o的5%，这一 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新浪科技 · 【#高途教育近一年亏损超10亿# #高途教育被指虚假宣传#】近日-20241220134002

昨天

i黑马 · 周鸿祎：在大模型时代，创业者值得干点什么？

2 天前

新浪科技 · 【中汽协：#1至11月新能源车国内销量破千万辆#，同比增长40.-20241219170000

2 天前

新浪科技 · 【研究发现#4千年前英国或现大规模人吃人事件#】上世纪70年代，-20241217183000

4 天前

36氪 · 山姆不是没有焦虑

5 天前

奔波儿灞与灞波儿奔 · 今日最涨姿势的一条冷知识！

4 月前

NorthStar酒店资产管理 · 酒店管理公司背后的技术服务支持力量

2 月前

人民数据 · 创新引领可信数据空间建设

2 周前