专栏名称: 半导体行业观察
最有深度的半导体新媒体,实时、专业、原创、深度,60万半导体精英关注!专注观察全球半导体最新资讯、技术前沿、发展趋势。
今天看啥  ›  专栏  ›  半导体行业观察

探秘全球最大GPU集群,20万GPU超算在路上

半导体行业观察  · 公众号  ·  · 2024-10-29 09:23

文章预览

👆如果您希望可以时常见面,欢迎标星🌟收藏哦~ 来源:内容综合自servethehome,谢谢。 今天,servethehome发布了 xAI Colossus 超级计算机之旅。对于那些听说过埃隆·马斯克的 xAI 在孟菲斯建造巨型 AI 超级计算机的人来说,这就是那个集群。这个价值数十亿美元的 AI 集群拥有 100,000 个 NVIDIA H100 GPU,不仅规模大,而且建造速度快。仅用 122 天,团队就建造了这个巨型集群。今天,我们将带您参观大楼内部。 Colossus 的基本构建模块是 Supermicro 液冷机架。它由 8 台 4U 服务器组成,每台服务器配备 8 个 NVIDIA H100,每台机架总共有 64 个 GPU。8 台这样的 GPU 服务器加上一台Supermicro 冷却液分配单元 (CDU)和相关硬件构成了一个 GPU 计算机架。 这些机架以八个为一组排列,共计 512 个 GPU,再加上网络,可在更大的系统内提供迷你集群。 在这里,xAI 使用的是 Supermicro 4U ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览