今天看啥  ›  专栏  ›  zartbot

从GTC25谈谈GPU互联

zartbot  · 公众号  ·  · 2025-03-30 18:42
    

文章预览

TL;DR GTC25上有一些Rubin互联相关的信息, 特别是老黄讲的什么“先要ScaleUP然后再ScaleOut”的观点,个人是不认同的, 这几天又看到华为UB-Mesh的论文, 再有一篇港科大的FuseLink的论文, 基本上和我一直以来认为ScaleUP和ScaleOut需要融合的观点是一致的, 因此做了一些分析. 1. Rubin NVL576 1.1 Rubin机柜结构 整个Rubin的机柜结构被称为Kyber, 由单个的计算柜配置一个Kyber SideCar的机柜构成 计算柜内由4个NVL144的计算机框构成, 每个计算框包含18个ComputeTray. 每个计算机框内部采用中背板(Mid-Plane)结构,计算板和交换板正交布局 MidPlane放大看连接器如下图, 我们从中背板结构可以看到单个Rubin Ultra 接插件有72个插头, 单个插头2个pin,如下所示, 累计带宽为3600GB/s, 那么每个pin就要50GB/s, 也就是说在NVLink Gen6/Gen7上会有448G Serdes 其实这样的结构对于连接器的稳定性和插损的要求会非常高, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览