注册
登录
专栏名称:
吃果冻不吐果冻皮
专注于AI工程化(LLM、MLOps、LLMOps、RAG、Agent)落地。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
旅行雷达助手
·
【0燃油费】川航新西兰中国800块含税一口价 ...
·
2 天前
常旅客专家
·
IHG低至75折还送4000分!GHA新增3 ...
·
3 天前
科研大匠
·
Springer ...
·
5 天前
募格学术
·
1本中科院1区Top期刊、1本2区Top期刊 ...
·
4 天前
常旅客专家
·
万豪又解锁新店!IHG超值活动收尾!每晚40 ...
·
5 天前
今天看啥
›
专栏
›
吃果冻不吐果冻皮
H100/A100/4090/A10 实测性能(算力篇)
吃果冻不吐果冻皮
·
公众号
· · 2024-08-16 08:00
文章预览
【点击】 加入大模型技术交流群 原文:https://zhuanlan.zhihu.com/p/713121901 由于众所周知的原因,某些GPU在某些地区销售是没有合法渠道 & 售后保障的,从奇怪的渠道购买GPU有概率买到翻新货、假货。 对于计算用途的GPU,我们通常会关心峰值算力、显存带宽、通信带宽三个指标,如果拿到的货这三个指标实测值和理论值相符咱就基本能安全下车了。 这里将分三篇分别说明每个指标怎么测,本文是第一篇: 算力篇。 想要简单快速又比较准的的测出实际峰值算力,可以使用CUTLASS profiler提供的GEMM算子进行测试。通常认为GEMM是计算受限的算子,且当下大热的Transformer模型,负载基本上都是GEMM,故GEMM测得的最优性能可以被当作GPU的实际峰值算力。从github上的CUTLASS仓库(https://github.com/NVIDIA/cutlass )克隆源码并且按照文档里的方法编译cutlass_profiler程序。使用方 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
旅行雷达助手
·
【0燃油费】川航新西兰中国800块含税一口价,往返1K5搞定;跨五一含税4K2起往返美国洛杉矶
2 天前
常旅客专家
·
IHG低至75折还送4000分!GHA新增3品牌可享免费早餐!
3 天前
科研大匠
·
Springer Nature推出适合投稿新手全新OA期刊:速度快,接收病例报告、数据说明等多种形式!
5 天前
募格学术
·
1本中科院1区Top期刊、1本2区Top期刊,被剔除!
4 天前
常旅客专家
·
万豪又解锁新店!IHG超值活动收尾!每晚4000分更有双倍房晚!
5 天前
人民数据
·
人民数据向中海华晟数字科技有限公司发放“数据资源持有权证书”
3 周前