专栏名称: 吃果冻不吐果冻皮

专注于AI工程化（LLM、MLOps、LLMOps、RAG、Agent）落地。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

槽值 · 网易沸点工作室多岗位实习生招聘中 · 昨天

一颗青杏 · “这个男人开车开得像个女人” · 3 天前

中国土木工程集团有限公司 · 战新出海，再传捷报！ · 3 天前

碳索储能 · 国顺科技集团有限公司独立储能示范项目（一期） ... · 3 天前

璀璨科学 · 天舟八号飞船发射！航天员汤洪波公开亮相：或无 ... · 6 天前

今天看啥 › 专栏 › 吃果冻不吐果冻皮

大模型量化技术原理：Atom、QuaRot

吃果冻不吐果冻皮 · 公众号 · · 2024-11-12 09:13

文章预览

近年来，随着Transformer、MOE架构的提出，使得深度学习模型轻松突破上万亿规模参数，从而导致模型变得越来越大，因此，我们需要一些大模型压缩技术来降低模型部署的成本，并提升模型的推理性能。模型压缩主要分为如下几类：剪枝（Pruning）知识蒸馏（Knowledge Distillation）量化（Quantization）本系列将针对一些常见大模型量化方案（GPTQ、LLM.int8()、SmoothQuant、AWQ等）进行讲述。大模型量化概述量化感知训练：大模型量化感知训练技术原理：LLM-QAT 大模型量化感知微调技术原理：QLoRA 训练后量化：大模型量化技术原理：GPTQ、LLM.int8() 大模型量化技术原理：SmoothQuant 大模型量化技术原理：AWQ、AutoAWQ 大模型量化技术原理：SpQR 大模型量化技术原理：ZeroQuant系列大模型量化技术原理：FP8 大模型量化技术原理：FP6 大模型量化技术原理：KIVI、IntactKV、KVQ ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

槽值 · 网易沸点工作室多岗位实习生招聘中

昨天

一颗青杏 · “这个男人开车开得像个女人”

3 天前

中国土木工程集团有限公司 · 战新出海，再传捷报！

3 天前

碳索储能 · 国顺科技集团有限公司独立储能示范项目（一期）升压站成套设备采购中标候选人公示

3 天前

碳索储能 · 国顺科技集团有限公司独立储能示范项目（一期）升压站成套设备采购中标候选人公示

3 天前

璀璨科学 · 天舟八号飞船发射！航天员汤洪波公开亮相：或无缘神舟二十号飞行任务？

6 天前

璀璨科学 · 天舟八号飞船发射！航天员汤洪波公开亮相：或无缘神舟二十号飞行任务？

6 天前

股市刀锋 · 看了这只股票的日k线，非常典型急促的A杀，第一天涨停第二天一字板-20240709111846

4 月前

科研职场说 · 探秘体制内：卫健委与疾控中心的职责、待遇与发展

3 月前