注册
登录
专栏名称:
SDNLAB
SDNLAB是专注网络创新技术的先锋媒体社区和实践应用平台,涵盖AI 网络、DPU/智能网卡、SD-WAN/SASE、Web3.0、零信任、云网融合等相关领域,提供新闻资讯、技术交流、在线实验、行业分析、求职招聘、教育培训等多元服务。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
厦门日报
·
非常便捷!全国首创!生活在厦门的你一定要知道
·
23 小时前
厦门日报
·
改革活力满满!厦门打造发展高地
·
昨天
厦门日报
·
厦门,又上榜了!
·
2 天前
今天看啥
›
专栏
›
SDNLAB
英伟达最新 GB300 & B300 细节曝光!
SDNLAB
·
公众号
· · 2024-12-30 15:30
文章预览
在 GB200 和 B200 发布仅 6 个月后,英伟达又推出了一款全新的 GPU,名为 GB300 和 B300。这次看似常规升级的背后,实则暗藏玄机。 B300 GPU 是基于台积电 4纳米工艺节点的全新流片,对计算芯片进行了优化设计。相比于B200,其性能的提升主要在以下两个方面: 算力:FLOPS性能提升50%;功耗增加200W(GB300和B300 HGX的TDP分别达到1.4KW和1.2KW,前代则为1.2KW和1KW);架构改进和系统级增强,例如CPU和GPU之间的动态功率分配(power sloshing)。 内存:HBM容量增加50%,从192GB提升至288GB;堆叠方案从8层HBM3E升级为12层;针脚速率保持不变,带宽仍为8TB/s。 为推理模型而生 内存的改进对于 OpenAI O3 这类大模型的训练和推理至关重要,因为随着序列长度的增加,KVCache也在增长,这限制了关键批处理大小和延迟。下图展示了英伟达当前几代 GPU 在处理 1k 输入令牌和 19k 输出令 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
厦门日报
·
非常便捷!全国首创!生活在厦门的你一定要知道
23 小时前
厦门日报
·
改革活力满满!厦门打造发展高地
昨天
厦门日报
·
厦门,又上榜了!
2 天前
审计实操
·
虚增存货6亿元,上市公司及财务总监被处罚
7 月前
科技狐
·
狐聊丨你认为高考能改变命运吗?
6 月前