文章预览
↑ 点击 蓝字 关注极市平台 作者丨oldpan 来源丨oldpan博客 编辑丨极市平台 极市导读 导读 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 正文 Pytorch的量化方法切换到了torchao,本篇基于官方教程简单介绍下torchao的量化使用教程。 使用 TorchAO 实现 GPU 量化 本篇对segment anything 模型进行量化和优化。参考了 segment-anything-fast 仓库时所采取的步骤。 本指南演示了如何应用这些技术来加速模型,尤其是那些使用 Transformer 的模型。为此,我们将重点关注广泛适用的技术,例如使用 torch.compile 进行性能优化和量化,并衡量其影响。 环境 实验环境: CUDA 12.1 A100-PG509-200,功率限制为 330.00 W 不同硬件可能结果不同。 conda create -n myenv python=3.10 pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu121 pip install git+https://githu
………………………………