专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
今天看啥  ›  专栏  ›  极市平台

GPU 矩阵乘实际可达最大FLOPS测量工具

极市平台  · 公众号  ·  · 2024-11-29 22:00
    

文章预览

↑ 点击 蓝字  关注极市平台 作者丨BBuf 来源丨GiantPandaCV 编辑丨极市平台 极市导读   介绍了一个用于测量GPU上矩阵乘法实际可达最大FLOPS的工具mamf-finder.py,可以搜索任意GPU上的最大Matmul FLOPS,并支持PyTorch的多种数据类型。文章提供了不同数据类型(包括FP16和FP8)的使用示例,并展示了如何在不同GPU(如A100、MI300X和H100)上进行特定范围的搜索以获得最佳性能。   >> 加入极市CV技术交流群,走在计算机视觉的最前沿 前言 在 https://github.com/stas00/ml-engineering/blob/master/compute/accelerator/benchmarks/mamf-finder.py 这里有一个可以在任意 GPU 上搜索最大 Matmul FLOPS 的脚本,使用起来非常简单,依赖也只有 PyTorch 库。之前只支持 FP16 数据类型,我帮助完善了一下支持 PyTorch 的各种数据类型,这里安利一下,只需要下载这个脚本就可以了。下面是使用方法: FP16 使用示 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览