注册登录

专栏名称: 吃果冻不吐果冻皮

专注于AI工程化（LLM、MLOps、LLMOps、RAG、Agent）落地。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

金铲铲阿助 · 金铲铲2.27更新解析，法师法强回调监察狙神削弱！ · 昨天

大厂日爆 · 腾讯组织架构调整，IEG迎来新变化 · 昨天

大厂日爆 · 腾讯组织架构调整，IEG迎来新变化 · 昨天

财联社AI daily · AI会玩宝可梦了！Claude打赢道馆馆主 · 2 天前

财联社AI daily · AI会玩宝可梦了！Claude打赢道馆馆主 · 2 天前

今天看啥 › 专栏 › 吃果冻不吐果冻皮

大模型量化技术原理：总结

吃果冻不吐果冻皮 · 公众号 · · 2024-12-10 21:12

文章预览

【点击】加入大模型技术交流群近年来，随着Transformer、MOE架构的提出，使得深度学习模型轻松突破上万亿规模参数，从而导致模型变得越来越大，因此，我们需要一些大模型压缩技术来降低模型部署的成本，并提升模型的推理性能。模型压缩主要分为如下几类：模型剪枝（Pruning）知识蒸馏（Knowledge Distillation）模型量化本系列将针对一些常见大模型量化方案（GPTQ、LLM.int8()、SmoothQuant、AWQ等）进行讲述。大模型量化概述量化感知训练：大模型量化感知训练技术原理：LLM-QAT 大模型量化感知微调技术原理：QLoRA 训练后量化：大模型量化技术原理：GPTQ、LLM.int8() 大模型量化技术原理：SmoothQuant 大模型量化技术原理：AWQ、AutoAWQ 大模型量化技术原理：SpQR 大模型量化技术原理：ZeroQuant系列大模型量化技术原理：FP8 大模型量化技术原理：FP6 大模型量 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

金铲铲阿助 · 金铲铲2.27更新解析，法师法强回调监察狙神削弱！

昨天

大厂日爆 · 腾讯组织架构调整，IEG迎来新变化

昨天

大厂日爆 · 腾讯组织架构调整，IEG迎来新变化

昨天

财联社AI daily · AI会玩宝可梦了！Claude打赢道馆馆主

2 天前

财联社AI daily · AI会玩宝可梦了！Claude打赢道馆馆主

2 天前

佐思汽车研究 · 佐思数据 | 中国乘用车激光雷达供应商TOP5

7 月前

sven_shi · 这里遇到的问题是老房子现在就需要钱来修，但是没钱；稍新的房子有钱-20240830201931

6 月前

果粉俱乐部 · 5.5mm！新 iPhone外观确认

1 月前

四川观察sctv · 宜宾筠连山体滑坡灾害已致1人遇难，28人失联

2 周前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号