专栏名称: AI TIME 论道
AI TIME是一群关注人工智能发展,并有思想情怀的青年学者创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,链接全球AI学者,以辩论的形式探讨人工智能领域的未来。
目录
今天看啥  ›  专栏  ›  AI TIME 论道

马斯克发布 Grok3,推理能力超 o3 mini(high) 和 DeepSeek-R1

AI TIME 论道  · 公众号  ·  · 2025-02-18 14:30
    

文章预览

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 在试图以 974 亿美元收购 OpenAI 的提议被拒绝后, 世界首富马斯克又搞了一个大动作 —— 刚刚,他发布了 号称“地球最聪明的 AI” ,Grok3,其由一个包含约 20 万个 GPU 的数据中心训练,计算能力是上一代模型 Grok 2 的“10 倍”,且使用了扩大的训练数据集。 据此前介绍,Grok 3 是在合成数据的基础上进行训练的,它能够通过重读数据来反思所犯的错误,从而达到逻辑上的一致性。 评测结果方面 ,Grok3 在 AIME'24(美国数学竞赛)、GPQA(研究生水平科学知识问答能力的基准测试)等测试中均取得了比 Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果。 尤其在推理方面 ,Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等测试中取得了压倒性的优势,最高分达到 96 分,超过了 o3 mini(high)、o1 和 D ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览