专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

英伟达年终核弹!全新B3004为o1推理大模型打造,RTX5090也曝光了

量子位  · 公众号  · AI  · 2024-12-26 11:25
    

主要观点总结

本文主要介绍了英伟达最新的AI芯片大礼包,包括GPU新核弹B300和附带CPU的超级芯片GB300。B300相比B200在产品层面和显存上都有显著提升,被评价为能让OpenAI o1/o3推理大模型的思维链长度在高batch size下达到10万tokens的唯一方案。此外,文章还涉及英伟达的RTX 5090显卡的曝光,有望支持8K超高清游戏。

关键观点总结

关键观点1: 英伟达发布新的AI芯片大礼包,包括B300 GPU和GB300超级芯片。

英伟达最新的AI芯片B300在产品层面和显存上相比B200都有显著提升,能够满足OpenAI o1/o3推理大模型的思维链长度需求。

关键观点2: 英伟达的B300系列芯片升级主要体现在工艺节点、增加功率和架构微创新上。

据爆料,B300系列的升级来源于工艺节点、增加功率以及架构微创新等方面。其显存也从HBM升级到更先进的HBM堆叠技术。

关键观点3: 显存升级对推理大模型至关重要。

显存的升级能够增加推理模型的思维链长度,提高处理效率,降低成本,对于推理大模型的发展至关重要。

关键观点4: 英伟达消费级显卡RTX 5090曝光。

RTX 5090显卡的PCB板曝光,据称配备超大显存,有望支持8K超高清游戏。


文章预览

梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI 英伟达老黄,成了今年的圣诞老黄。 AI芯片大礼包刚刚曝光: GPU新核弹 B300 ,以及附带CPU的超级芯片 GB300 。 高算力 ,在产品层面上相比B200在FLOPS上提高50% 大显存 ,从192GB提升到288GB,也是提高了50%。 △ Grok  AI绘图 包含72块GB300的“新一代计算单元 ”GB300 NVL72 ,更是被评价为“能让OpenAI o1/o3推理大模型的思维链长度,在高batch size下达到10万tokens的唯一方案”。 ‍ 这与今年3月份“AI春晚”发布的B200系列 只隔了几个月 。 根据SemiAnalysis爆料,从第三季度开始, 许多AI巨头已经将订单从B200转移到了B300 (只有微软还在第四季度继续购买了部分B200) 。 有不少网友感叹,更新速度实在太快了! 既是解决了此前传闻中B200因设计缺陷被迫推迟的问题,又是对隔壁AMD MI300系列后续产品将在2025年提升显存容量的回 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览