主要观点总结
文章主要讨论了关于CoWoS-L量产的谣言、产能情况、产品特性及未来趋势。文章还提到了训练在适应模型未来方面的重要性,以及对于全行业来说模型变得更加smart和效率提升的好处。
关键观点总结
关键观点1: 辟谣CoWoS-L良率问题
文章首先辟谣了关于CoWoS-L良率不到一定水平就不能量产的说法,并提到明年产能会按照需求增加。
关键观点2: 产品特性与市场需求
文章讨论了产品的大杯限量发售和小杯量大管饱的特性,并探讨了需求来源。
关键观点3: 关于模型效率的提升
文章提到从训练到部署都在变得更有效率,模型变得更加smart与模型大小不那么线性相关,这是全行业的好事。
关键观点4: 关于未来推理任务的关键考虑
文章讨论了保留FP4+铜缆rack方案可能是保持推理性能优势的关键,并提到液冷需求可能被过度强调。
文章预览
先帮辟个谣,CoWoS-L 良率不到一定水平就不能量产了?假 这么一搞,明年产能要多少给多少...S 台+外协一大把。 大杯限量发售,小杯量大管饱! 那你说,25 EPS应该上调还是下调... Delay嘛,没多久;加单嘛,一大把...这24年还是下调吗... 需求从哪儿来?反正 training 早就指望不上了,尤其 pre train,2 年采样一次,你说还能贡献多少比例,剩下的大头自然是... GB200A NVL36在去适配什么样的下游任务,除了降级air cool老黄觉得“你们都是穷逼跟不上液冷”,还在去适应模型什么样的未来?是否过去超大模型推理的假设遇到了一些变化...显然模型变得更加smart与模型大小不那么线性相关了。对全行业来说,这是件好事。从training到部署,都在变得更efficient。(这不耽误CSP对GB200趋之若鹜)回想当时GB200推出时的两点震撼:a)高带宽域72甚至576,超大模型pre train模
………………………………