专栏名称: 吃果冻不吐果冻皮
专注于AI工程化(LLM、MLOps、LLMOps、RAG、Agent)落地。
目录
今天看啥  ›  专栏  ›  吃果冻不吐果冻皮

NVIDIA GPGPU通信架构

吃果冻不吐果冻皮  · 公众号  ·  · 2024-07-18 11:50
    

文章预览

【点击】 加入大模型技术交流群 写在前面 此一部分,介绍nvlink、nccl、nvswitch、gpgpu 之间的具体联动关系。侧重于介绍通信系统本身,以及和计算的耦合性,Nvlink & nvswitch system 为 nvidia gpgpu 大规模计算和超大算力的支持可以说是十分重要的,为此有必要单列一章进行分析介绍。 NVLink 之前 传统互联通路的失灵 - PCIE太慢了 PCIe 技术是PCI 技术的扩展,最初由Intel 于2001年公布,原名3GIO(第三代IO),在2002年由PCI-SIG 审核通过,改名为PCI express,此后,每一代带宽都是前一代的2倍,PCIE gen 5 每lane为32Gbps,折合为3938MB/s,gen 5 x16 即为64GB/s。2022年公布PCie gen 6 specification,每lane 带宽为64Gbps,x16 可达1Tbps 以上。 第一代Nvlink 起于pascal,2016年,Pcie 3.0 时期,彼时,gen3 x16的带宽只有128Gbps,也就是16GB/s,而且是机器上所有的设备只能共享这个带宽,而显然对于一 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览