重磅！OpenAI推出o3模型系列：彻底颠覆AI怀疑论者，AGI评测基准达到惊人87.5%

AI寒武纪 · 公众号 · · 2024-12-21 03:25

文章预览

OpenAI推出o3模型系列(因为o2和英国电信商命名有冲突，所以跳过了o2)，包括o3,o3mini ，o3 mini low（低计算力）,o3mini medium（中等计算力），o3mini high（高计算力）废话不多多说，直接看o3硬核测试表现 o3在ARC-AGI（通用人工智能评估基准）上取得了惊人的高达87.5%的分数，而人类是85% ！ ARC-AGI 创始人对这一测试结果的详细解读：今天，OpenAI 发布了其下一代推理模型 o3。我们与 OpenAI 合作，在 ARC-AGI 上对其进行了测试，我们相信它在让人工智能适应新任务方面取得了重大突破。在低计算模式下（每个任务的计算费用为 20 美元），它在半私人评估中的得分率为 75.7%；在高计算模式下（每个任务的计算费用为数千美元），它的得分率为 87.5%。它的成本很高，但并不只是蛮干 -- 这些能力是全新的领域，需要科学界的认真关注” 那么，这就是 AGI 吗？虽然新模 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博