回顾PyTorch Eager Mode 量化 TensorRT 加速

oldpan博客 · 公众号 · · 2024-11-18 19:35

文章预览

from https://leimao.github.io/blog/PyTorch-Eager-Mode-Quantization-TensorRT-Acceleration/ 从 PyTorch 2.3.0 开始，PyTorch 提供了三种量化接口：eager mode 量化、FX graph mode 量化以及 PyTorch 2 Export 量化。由于最新的 PyTorch 2 Export 量化接口阻止了量化后的 PyTorch 模型导出为 ONNX，因此若不开发自定义的 PyTorch FX graph 量化后端（比如 fx2trt [1] ），就无法使用 TensorRT 加速模型推理。而 eager mode 量化和 FX graph mode 量化接口都支持将量化后的 PyTorch 模型导出为 ONNX，可以进一步使用 TensorRT 进行优化和加速。尽管 FX graph mode 量化接口更加灵活和强大，但某些使用场景下，使用 eager mode 量化接口仍是不可避免的。在这篇文章中，我将展示如何使用 TensorRT 加速 PyTorch eager mode 量化接口生成的量化模型。同样的方法也适用于 FX graph mode 量化接口生成的量化模型，因为这两种量化模型都可以导出 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

中国药闻 · 车市迎来换新潮

昨天

现代快报 · 最新通告：太湖封航

昨天

宝鸡市场监管 · 宝鸡市市场监督管理局召开学校食品安全集中约谈会暨校园食品快检座谈会

昨天

天津日报 · 盒马，被立案调查！

2 天前

天津日报 · 盒马，被立案调查！

2 天前

中国药闻 · 首批13家外资企业获增值电信业务经营试点批复

3 天前

事考必过 · 荐！本周·教基轻松学考点汇总

9 月前

中国市场监管报 · 首席质量官访谈 | “小玉米”长出“大产业”——访河南金丹乳酸科技股份有限公司首席质量官申建

3 周前

大众新闻-大众日报 · 突发！美国航母，撞了

2 周前

广州乐居 · 公布规划了！越秀区单价10万+项目，即将炸场！

2 周前