马斯克20万块GPU炼出Grok-3，暴击DeepSeek R1数学屠榜！疯狂复仇OpenAI

机器学习研究组订阅 · 公众号 · AI · 2025-02-18 18:12

主要观点总结

文章介绍了人类史上首个在20万块GPU上训练的模型Grok-3的发布，包括其强大的推理能力、在多项基准测试中的表现、与OpenAI的对比等。该模型展现出惊人的数学和科学能力，可完成复杂的逻辑推理任务。马斯克对此充满信心，表示未来有可能将Grok模型用于现实世界任务如打造特斯拉或发射火箭。此外，Grok团队还推出了DeepSearch智能体，可更深入地搜索互联网并提供详细合理的答案。文章还提到了Grok团队的训练计算量、模型迭代过程等细节。

关键观点总结

关键观点1: Grok-3成为首个在大量GPU上训练的模型，展现了强大的性能。

Grok-3在多项基准测试中刷新了SOTA，大幅超越了其他模型，如DeepSeek-R1和Gemini-2 Pro等。其在数学、科学、编码等方面表现出色，成为名副其实的'世界上最聪明的模型'。

关键观点2: Grok-3具备强大的推理能力，可以完成复杂的任务。

Grok-3能够完成如生成地球发射、火星着陆及下一次发射窗口返回的动画代码等高级推理任务。其思维过程可以通过'Think'模式和'Big Brain'模式进行展示。

关键观点3: DeepSearch智能体的推出，使Grok-3能够在互联网上进行更深入搜索。

DeepSearch智能体能够快速高效地进行信息检索，提供详细合理的答案，并且其信息检索过程对用户更加透明。

文章预览

人类史上首个在20万块GPU上训出的模型终于问世！刚刚，马斯克带队三位xAI成员在线开启直播，官宣Grok-3全家桶—— Grok-3（Beta）、Grok-3 mini 首个推理模型Grok-3 Reasoning（Beta）、Grok-3 mini Reasoning：击败o3-mini/DeepSeek-R1，解锁推理时计算首个AI智能体「DeepSearch」：联网深入搜索一股OpenAI发布会的味道扑面而来据介绍，三代Grok的训练计算量竟是Grok-2的10倍，那么实际表现又如何？世界最大超算集群Colossus已有20万块GPU：10万块GPU同步训练（第一阶段用时122天搭建）；20万GPU（第二阶段用时92天）在多项基准测试中，Grok-3在数学（AIME 2024）、科学问答（GPQA）、编码（LCB）上刷新SOTA，大幅超越DeepSeek-V3、Gemini-2 Pro、GPT-4o。 Grok-3 mini的性能基本上领先或媲美其他闭源/开源模型。在著名大模型LMSYS Arena排行榜中，Grok-3（chocolate终于揭秘）刷榜，Elo评分超1400位列 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博