文章预览
👆如果您希望可以时常见面,欢迎标星🌟收藏哦~ 来源:内容综合自servethehome,谢谢。 今天,servethehome发布了 xAI Colossus 超级计算机之旅。对于那些听说过埃隆·马斯克的 xAI 在孟菲斯建造巨型 AI 超级计算机的人来说,这就是那个集群。这个价值数十亿美元的 AI 集群拥有 100,000 个 NVIDIA H100 GPU,不仅规模大,而且建造速度快。仅用 122 天,团队就建造了这个巨型集群。今天,我们将带您参观大楼内部。 Colossus 的基本构建模块是 Supermicro 液冷机架。它由 8 台 4U 服务器组成,每台服务器配备 8 个 NVIDIA H100,每台机架总共有 64 个 GPU。8 台这样的 GPU 服务器加上一台Supermicro 冷却液分配单元 (CDU)和相关硬件构成了一个 GPU 计算机架。 这些机架以八个为一组排列,共计 512 个 GPU,再加上网络,可在更大的系统内提供迷你集群。 在这里,xAI 使用的是 Supermicro 4U
………………………………