主要观点总结
本文介绍了关于发热问题、业绩预期、目前气氛、最大风险以及除数字外需关注的其他方面的报告。文章指出发热问题处于持续改善过程中,不是突发情况,预计不会造成进一步延迟。业绩预期略微偏高,焦点在于4Q收入指引。目前气氛不如上个季度紧张,供应链问题影响节奏而非需求。最大风险在于“审美”变化,AI capex在TMT加仓中边缘化。除此之外,还需关注明年毛利率、客户任务负载变化、Scaling law争论等。
关键观点总结
关键观点1: 发热问题
发热问题是老问题,但处于持续改善过程中,预计不会造成严重的进一步延迟。Acecamp的Patrick文章详细介绍了发热问题的来龙去脉。
关键观点2: 业绩预期
业绩预期略微偏高,焦点在于4Q收入指引。最近的各种利空可能会降低心理预期,回调多的话,心理预期或许能低点。
关键观点3: 目前气氛
目前气氛不如上个季度紧张,受Blackwell传闻delay影响较小。Q2业绩期整体气氛紧张,但英伟达业绩猛涨,预期较高。现在争论的scaling law和2026 capex可持续性都是需求问题。
关键观点4: 最大风险
最大风险在于“审美”变化,AI capex在TMT加仓中边缘化,是个不太好的信号。
关键观点5: 其他关注点
除了以上几点,还需关注明年毛利率、客户任务负载变化、Scaling law争论等。这些报告和讨论都在星球了。
文章预览
1. The Information报道 的发热overheating,应该就是7月份出现的老问题,也是个老大难问题了。但处于持续改善过程中,并不是什么突发情况,预计也不会造成严重的further delay。 详细的关于发热问题的来龙去脉Acecamp的Patrick文章介绍得很清楚: 从H100看,新产品过热问题是普遍的,根据行业经验,大部分故障都是可修复的,主要源于元器件在高温环境下的个体差异性表现。故障率呈现3个月之后大幅下降的曲线。 GB200面临的具体挑战:温度均匀性问题,以往判定系统是否正常的标准是观察8张卡的温度均匀性。然而现在更常见的是单卡局部过热的情况,这会导致单卡掉卡一系统中断一训练中断一需要重新训练。 目前GB200有两个批次(主要区别是芯片的两个批次,改版前和改版后)。测试也分为两个阶段。ODM厂商主要进行压力测试和信号测试,通过模拟客户业
………………………………