文章预览
重磅新课 ! 5折优惠 即将结束! ESD与Latch-up:高抗性与解决方案 数字中后端课程 DFT设计与实现(理论) DFT设计与实现(实践) 英伟达(Nvidia)发布了 其 Blackwell B4.1 GPU的第一个 MLPerf 200 结果 。结果显示,Blackwell GPU 的性能是其基于 Hopper 架构的前身 H100 的四倍,凸显了英伟达作为 AI 硬件领导者的地位。但是,我们需要指出一些注意事项和免责声明。 根据英伟达的结果,基于Blackwell 的 B200 GPU 在服务器推理测试中在单个 GPU 上提供 10755 个tokens/秒,在离线参考测试中提供 11264 个tokens/秒。从其 公开可用的 MLPerf Llama 2 70B 基准测试结果 https://public.tableau.com/app/profile/data.visualization6666/viz/MLCommons-InferenceDatacenter/MLCommons-Inference 发现基于 4 路 Hopper H100 的机器提供了类似的结果,这证明了英伟达的说法,即单个 Blackwell 处理器比单个 Hopper H100 GPU 快约 3.7 倍至 4 倍。
………………………………