文章预览
受芯片禁令的影响,国内很多小伙伴对大模型训练部署的 GPU 型号感知可能还停留在 H100 甚至 A100 上面。 但其实在 H100 之后,不仅诞生了同样是 Hopper 架构的 H200 芯片(于 2023 年底发布),而且 2024 年上半年,英伟达还发布了超越 Hopper 架构的全新 Blackwell 架构。 搭载最新 Blackwell 架构的 GPU 芯片,便是 B200。 由两个 Blackwell B200 GPU 和一个 Grace CPU 组成的 AI 超级芯片,便是为 GB200 ,如下图所示。 根据相关测试 ,GB200 的大模型训练性能大约是 H100 的 4 倍。 在部分多模态场景下,推理性能甚至能达到 H100 的 30 倍。 但这还不够,更恐怖的是, 在能耗方面,GB200 却仅为 H100 的 1/25,仅仅为 4%。 [4] 这恐怖的性能和能效提升,相比 H100 绝对是代际层面的跨越。 但据 The Information 报道[1],近期,英伟达的一些大客户在数据中心部署 GB200 服务器时,遇到了交付延
………………………………