专栏名称: 江大白
专业有趣的AI内容平台,关注后回复【算法】,获取45家大厂的《人工智能算法岗江湖武林秘籍》
今天看啥  ›  专栏  ›  江大白

掀桌子了!满血版3万Tokens每秒,英伟达捅破DeepSeek推理天花板!关键技术全揭秘!

江大白  · 公众号  ·  · 2025-03-20 08:00
    

文章预览

以下 文 章来源于微信公众号:特大号 作者:NVIDIA blog 链接:https://mp.weixin.qq.com/s/rkB1GmpGKgYqaFYqfR2C3Q 本文仅用于学术分享,如有侵权,请联系 后 台作删文处理 导读 英伟达在2025 GTC大会上发布Blackwell架构,搭载8颗GPU的DGX系统创下DeepSeek-R1推理性能新纪录,峰值达每秒30,000个token。通过硬件优化与TensorRT等软件生态,显著提升AI模型推理效率与精度,推动生成式AI与图像生成领域突破! 30000个tokens每秒,太炸裂了! 昨天,英伟达在2025GTC大会上宣布了创世界纪录的满血 DeepSeek-R1 推理性能。 DGX系统搭载八颗NVIDIA Blackwell GPU,在DeepSeek-R1模型(6710亿参数)推理任务中创下了世界纪录↓ 单用户推理速度超过每秒250个token,峰值吞吐量超过每秒30000个token。 这一突破性的性能提升,得益于针对NVIDIA Blackwell架构深度优化的NVIDIA开放生态推理开发工具链。 但这还是 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览