文章预览
OpenAI推出o3模型系列(因为o2和英国电信商命名有冲突,所以跳过了o2),包括o3,o3mini ,o3 mini low(低计算力),o3mini medium(中等计算力),o3mini high(高计算力) 废话不多多说,直接看o3硬核测试表现 o3在ARC-AGI(通用人工智能评估基准)上取得了惊人的高达87.5%的分数,而 人类是85% ! ARC-AGI 创始人对这一测试结果的详细解读: 今天,OpenAI 发布了其下一代推理模型 o3。我们与 OpenAI 合作,在 ARC-AGI 上对其进行了测试,我们相信它在让人工智能适应新任务方面取得了重大突破。在低计算模式下(每个任务的计算费用为 20 美元),它在半私人评估中的得分率为 75.7%;在高计算模式下(每个任务的计算费用为数千美元),它的得分率为 87.5%。它的成本很高,但并不只是蛮干 -- 这些能力是全新的领域,需要科学界的认真关注” 那么,这就是 AGI 吗? 虽然新模
………………………………