专栏名称: GiantPandaCV
专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创,每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你,大家一起共同进步(・ω<)☆
目录
相关文章推荐
今天看啥  ›  专栏  ›  GiantPandaCV

通过微基准测试和指令级分析(Instruction-level Analysis)揭秘英伟达Ampere架构

GiantPandaCV  · 公众号  · 3D  · 2024-08-17 22:22
    

文章预览

通过微基准测试(Microbenchmarking)和指令级分析(Instruction-level Analysis)揭秘英伟达Ampere架构 这是 CUDA-MODE课程笔记 第8课: CUDA性能检查清单 里面提到的2篇Paper的其中一篇,讲的是通过微基准测试(Microbenchmarking)和指令级分析(Instruction-level Analysis)揭秘英伟达Ampere架构,这里做一个解读做为CUDA-MODE第8课的知识补充。 题目 & 作者 论文链接:https://arxiv.org/pdf/2208.11174 论文题目为"通过微基准测试(Microbenchmarking)和指令级分析(Instruction-level Analysis)揭秘英伟达Ampere架构"。下面列出了4位作者的相关信息,他们分别来自新墨西哥州立大学(New Mexico State University)和洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)。 这篇paper里面做micro benchmark的代码也开源了一部分:https://www.stuffedcow.net/research/cudabmk?q=research/cudabmk 和 WMMA 指令相关的 micro benchmark 测试代码没有公开。此外,这 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览