专栏名称: zartbot
随便记录点有趣的东西
今天看啥  ›  专栏  ›  zartbot

谈谈下一代AI训练网络架构

zartbot  · 公众号  ·  · 2024-08-12 23:11

文章预览

看到Meta在CTSW上用了带HBM的Jericho2,buffer深度10ms, 还大言不惭说就此不需要DCQCN了? 反正22us延迟也不是个事情, 成本也不考虑, 连RTSW到CTSW 2倍带宽的事情都干的出来. 于是我给这群人和他们的信徒们出个招, 而且还在以太网上可以很容易的实现在网计算, 根本不需要什么拥塞控制.  于是我们可以设计下面这种超级CTSW, 提供极致的 Smart Core Dumb Edge 解决方案. 直接把Intel Gaudi3当Jericho2来卖, 整个集群提供3072个200G接口, 并且提供总计高达32TB的buffer,既有以太网的ScaleUP, 还有ScaleUP和ScaleOut的融合, 还可以帮助Intel提升市值. 你们不是特别喜欢在网计算么, 直接把计算节点当网络节点卖不就行了? 大概算了一下,如果一颗Gaudi3大概10K USD,平均每端口成本也就1K USD不到呀. 看看Intel现在这个市值和大量Gaudi3的销路问题, 还不如把它当颗带HBM交换芯片卖了? 让他们给个骨折价估 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览