专栏名称: CV技术指南
长期更新:深度学习、计算机视觉相关技术的总结;图像处理相关知识;最新论文;经典论文;论文综述、tensorflow和pytorch等内容总结。涉及领域 :神经网络模型、transformer模型、目标检测、语义分割、目标跟踪、视频理解等。
今天看啥  ›  专栏  ›  CV技术指南

小模型量化更新小事

CV技术指南  · 公众号  ·  · 2024-09-04 12:45

文章预览

前言   简单聊聊基于TensorRT的量化在2024年发展成什么样了。 Pytorch训练营,花两个星期彻底掌握代码实现 CV各大方向专栏与各个部署框架最全教程整理 CV全栈指导班、基础入门班、论文指导班 全面上线!! 在TensorRT版本10.x前, 量化方式 一般有两种: 隐式量化,通过trt提供的trtexec api校准得到scale然后构建量化模型,或者已有scale,python api直接设置scale再构造模型 显式量化,通过QDQ节点量化,QDQ中包含了scale,通过trt的quantize和dequantize节点去显式控制量化节点 首先说下隐式量化,大家应该都用过 trtexec --onnx=model.onnx --saveEngine=model.engine --fp16 --int8 这类似的命令,这个命令会直接执行implicit quantization (IQ),校准同时寻找性能最优的op(可能是int8可能是fp16),只支持CNN模型(transformer的不大行),量化精度不是特别可控,不好复现,这个方式也只支持INT8。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览