文章预览
要实现超强的AI能力,需要超大规模的模型,要训练超大规模的AI模型,需要数千,甚至上万的GPU协同工作。 这就带来几个问题:更多的GPU造成的 高 能耗,计算卡与 计算卡 之间的通信延迟,计算集群与计算集群之间的通信延迟和算力损耗。 每一次开发布会, NVIDIA 都会强调其NVLink芯片间互联技术。目前它的最新产品是NVL72平台,能够将72个NVIDIA Blackwell计算单元连接在一起,其芯片间总传输速度是7Tbps。 那么,如果用光来计算,用光来传输,会怎么样?一家专注于光子计算的公司Lightmatter已经将芯片互连速度提高到30Tbps,100Tbps的版本也在路上。它有光子计算单元,有光学芯片封装和传输技术,能够系统化提升整个AI计算集群的计算力,计算效率,并降低功耗。Lightmatter声称,其产品有能力支持万亿级参数的大语言模型训练,并有望帮助AI实验室们探
………………………………