今天看啥  ›  专栏  ›  硅星人Pro

马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

硅星人Pro  · 公众号  · 科技媒体  · 2024-08-05 09:27
    

主要观点总结

文章介绍了特斯拉为了训练其自动驾驶系统和人形机器人Optimus,打造了一个庞大的超算集群Dojo。该集群使用了特斯拉自家的D1芯片和英伟达GPU,具备超强的计算能力。文章还提到了Dojo的建设过程、面临的挑战以及未来规划。

关键观点总结

关键观点1: 特斯拉打造超算集群Dojo,用于训练自动驾驶系统和人形机器人Optimus。

Dojo由数十万个GPU组成,包括特斯拉自家的D1芯片和英伟达GPU。它的计算能力强大,能够支持特斯拉的自动驾驶系统和人形机器人的训练需求。

关键观点2: Dojo的建设和扩展方式。

Dojo由多个ExaPOD组成,每个ExaPOD包含多个机架和机柜。特斯拉还研发了D1芯片和D2芯片,以提高计算能力和解决信息流瓶颈。Dojo还使用了晶圆级处理器技术,将多个芯片集成在一起,以提高性能和效率。

关键观点3: 特斯拉面临的主要挑战和解决方案。

特斯拉面临的主要挑战是获取足够的计算资源和硬件支持。为了解决这个问题,特斯拉自主研发了D1芯片和正在研发D2芯片,并使用了英伟达的GPU。此外,特斯拉还在建设庞大的冷却系统,以支持超算集群的运行。

关键观点4: Dojo的未来规划和可能的影响。

摩根士丹利预测,Dojo未来可以通过robotaxi和软件服务等形式释放新的收入来源,为特斯拉的市值增加5000亿美元。特斯拉还在开发新的芯片和技术,以支持更广泛的AI训练任务,并建立类似于AWS和Azure的云计算平台。


文章预览

文章转载于新智元 为了训出最强Grok 3,xAI耗时19天,打造了由10万块H100组成的世界最大超算集群。 而在训练FSD、擎天柱机器人方面,马斯克同样不惜重金,投入了大量的计算资源。 超算Dojo,是特斯拉AI的基石,专为训练FSD神经网络而打造。 就在今天,他在德州超级工厂(Cortex)参观了特斯拉的超级计算机集群。 马斯克称,「这将是一个拥有约10万个H100/H200 GPU,并配备大规模存储的系统,用于全自动驾驶(FSD)和Optimus机器人的视频训练」。 不仅如此,除了英伟达GPU,这个超算集群中还配备了特斯拉HW4、AI5、Dojo系统。 它们将由一个高达500兆瓦的大型系统提供电力和冷却。 2021年特斯拉AI Day上,马斯克首次对外宣布Dojo。 如今三年过去了,Dojo建得怎样了? 1 8000块H100等价算力,加倍下注 半个月前,网友称2024年年底,特斯拉拥有AI训练算力,等价于9 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览