专栏名称: 半导体产业纵横
半导体产业纵横是神州数码半导体产业生态服务平台下的自媒体账号,立足产业视角,提供及时、专业、深度的前沿洞见、技术速递、趋势解析,赋能中国半导体产业,我们一直在路上。
今天看啥  ›  专栏  ›  半导体产业纵横

马斯克用20万张H100训练出1400分大模型

半导体产业纵横  · 公众号  ·  · 2025-02-18 17:30
    

文章预览

本文由半导体产业纵横(ID: I CVI EWS )综合 xAI发布最新一代大模型Grok 3。 马斯克旗下人工智能公司xAI发布了其最新一代大模型 Grok 3,目前Grok已经推出了专属的 Grok.com 网页,供用户体验Grok系列模型。 马斯克称,Grok 3能力较前代产品Grok 2提升了“一个数量级”,并且是一款“追求极致真实”的 AI。   20万张H100训练出1400分大模型 Grok 3早期化名“巧克力”打榜LMSYS,一举夺魁并成为唯一一个得分超1400的模型。竞技场(lmarena.ai)官方评价Grok 3是首个突破1400分的模型,并且在所有类别中排名第一。 去年马斯克剧透,Grok 3在10万张H100上进行训练,是首个达到如此训练集群规模的模型。这比Grok 2多了数倍不止,要知道Grok 2训练大约使用了2万个H100。但是令人震惊的是,实际上Grok3训练过程中集群规模再次扩展到了20万卡。 Grok 3比Grok 2快十倍,在Grok3中大规 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览