文章预览
以下 文 章来源于微信公众号:oldpan博客 作者:小潘潘 链接:https://mp.weixin.qq.com/s/UmRu_l7WsXaBvYY3x1NcBg 本文仅用于学术分享,如有侵权,请联系 后 台作删文处理 导读 大模型部署的过程中,通常需要量化的过程,不过为什么要量化,以及如何量化?本文对此做了详细解释,同时也准备了详尽的量化教程,希望对大家有所帮助。 本文翻译整理自: https://pub.towardsai.net/want-to-learn-quantization-in-the-large-language-model-57f062d2ec17 简单介绍下大模型的为什么需要量化,以及量化的基本操作。 首先,了解 量化 的 是什么 以及 为什么 需要它。 接下来,深入学习 如何 进行 量化 ,并通过一些简单的数学推导来理解。 最后编写一些 PyTorch 代码 ,以对 LLM 权重参数进行量化和反量化。 Let’s unpack all one by one together. 什么是量化,为什么需要它? 量化 是一种将较大尺寸的
………………………………