主要观点总结
本文主要介绍了英伟达最新的AI芯片大礼包,包括GPU新核弹B300和附带CPU的超级芯片GB300。B300相比B200在产品层面和显存上都有显著提升,被评价为能让OpenAI o1/o3推理大模型的思维链长度在高batch size下达到10万tokens的唯一方案。此外,文章还涉及英伟达的RTX 5090显卡的曝光,有望支持8K超高清游戏。
关键观点总结
关键观点1: 英伟达发布新的AI芯片大礼包,包括B300 GPU和GB300超级芯片。
英伟达最新的AI芯片B300在产品层面和显存上相比B200都有显著提升,能够满足OpenAI o1/o3推理大模型的思维链长度需求。
关键观点2: 英伟达的B300系列芯片升级主要体现在工艺节点、增加功率和架构微创新上。
据爆料,B300系列的升级来源于工艺节点、增加功率以及架构微创新等方面。其显存也从HBM升级到更先进的HBM堆叠技术。
关键观点3: 显存升级对推理大模型至关重要。
显存的升级能够增加推理模型的思维链长度,提高处理效率,降低成本,对于推理大模型的发展至关重要。
关键观点4: 英伟达消费级显卡RTX 5090曝光。
RTX 5090显卡的PCB板曝光,据称配备超大显存,有望支持8K超高清游戏。
文章预览
梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI 英伟达老黄,成了今年的圣诞老黄。 AI芯片大礼包刚刚曝光: GPU新核弹 B300 ,以及附带CPU的超级芯片 GB300 。 高算力 ,在产品层面上相比B200在FLOPS上提高50% 大显存 ,从192GB提升到288GB,也是提高了50%。 △ Grok AI绘图 包含72块GB300的“新一代计算单元 ”GB300 NVL72 ,更是被评价为“能让OpenAI o1/o3推理大模型的思维链长度,在高batch size下达到10万tokens的唯一方案”。 这与今年3月份“AI春晚”发布的B200系列 只隔了几个月 。 根据SemiAnalysis爆料,从第三季度开始, 许多AI巨头已经将订单从B200转移到了B300 (只有微软还在第四季度继续购买了部分B200) 。 有不少网友感叹,更新速度实在太快了! 既是解决了此前传闻中B200因设计缺陷被迫推迟的问题,又是对隔壁AMD MI300系列后续产品将在2025年提升显存容量的回
………………………………