【深度学习】既然英伟达A100/H100 太贵，为什么不用 4090？

深度学习基础与进阶 · 公众号 · · 2024-10-25 17:09

文章预览

作者丨李博杰@知乎（已授权）来源丨 https://zhuanlan.zhihu.com/p/655402388 编辑丨极市平台导读大模型的训练用 4090 是不行的，但推理（inference/serving）用 4090 不仅可行，在性价比上还能比 H100 稍高。4090 如果极致优化，性价比甚至可以达到 H100 的 2 倍。（长文预警：本文按 Word 计数法 16000 字，按知乎计数法 24000 字）这是一个好问题。先说结论，大模型的训练用 4090 是不行的，但推理（inference/serving）用 4090 不仅可行，在性价比上还能比 H100 稍高。4090 如果极致优化，性价比甚至可以达到 H100 的 2 倍。事实上， H100/A100 和 4090 最大的区别就在通信和内存上，算力差距不大。 H100 A100 4090 Tensor FP16 算力 989 Tflops 312 Tflops 330 Tflops Tensor FP32 算力 495 Tflops 156 Tflops 83 Tflops 内存容量 80 GB 80 GB 24 GB 内存带宽 3.35 TB/s 2 TB/s 1 TB/s 通信带宽 900 GB/s 900 GB/s 64 GB/s 通信时 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

FM93交通之声 · 热搜第一！女演员称劝阻男子抽烟却被抢手机！多方回应，网友热议……

昨天

FM93交通之声 · 突发公告，立案调查！

2 天前

FM93交通之声 · 突发！一客机在哈萨克斯坦坠毁

2 天前

FM93交通之声 · 张馨予晒妈妈与张颂文合照！并配文：“妈妈特意来探班，其实另有目的”

3 天前

FM93交通之声 · 热搜第一，刘诗诗方回应离婚传言

3 天前

长沙住房公积金 · 以案说法：单位不办理住房公积金缴存登记被罚5万元

4 月前