注册登录

专栏名称: oldpan博客

老潘的博客，程序员眸中的fantasy life，分享AI技术干货，让大家少走弯路~

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

何乐不为 · 速度！积分大放水，下手不犹豫！ · 18 小时前

少数派 · 城市漫步指南：济州岛，需要好天气 · 21 小时前

中国旅游报 · 过境免签新政发布、多地年夜饭预订火爆 ... · 3 天前

营销案例精选 · 浏阳文旅烟花惊呆老外，网友：宣传部加鸡腿！ · 3 天前

精明常旅客 · 携程换东航加赠200%！4000分换600东 ... · 3 天前

今天看啥 › 专栏 › oldpan博客

大模型量化技术原理：FP8

oldpan博客 · 公众号 · · 2024-08-27 10:10

文章预览

【点击】加入大模型技术交流群近年来，随着Transformer、MOE架构的提出，使得深度学习模型轻松突破上万亿规模参数，从而导致模型变得越来越大，因此，我们需要一些大模型压缩技术来降低模型部署的成本，并提升模型的推理性能。模型压缩主要分为如下几类：剪枝（Pruning）知识蒸馏（Knowledge Distillation）量化Quantization）本系列将针对一些常见大模型量化方案（GPTQ、LLM.int8()、SmoothQuant、AWQ等）进行讲述。大模型量化概述量化感知训练：大模型量化感知训练技术原理：LLM-QAT 大模型量化感知微调技术原理：QLoRA 训练后量化：大模型量化技术原理：GPTQ、LLM.int8() 大模型量化技术原理：SmoothQuant 大模型量化技术原理：AWQ、AutoAWQ 大模型量化技术原理：SpQR 大模型量化技术原理：ZeroQuant系列大模型量化技术原理：FP8 大模型量化技术原理：FP6 大模型 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

何乐不为 · 速度！积分大放水，下手不犹豫！

18 小时前

少数派 · 城市漫步指南：济州岛，需要好天气

21 小时前

中国旅游报 · 过境免签新政发布、多地年夜饭预订火爆 ……本周热点请关注

3 天前

营销案例精选 · 浏阳文旅烟花惊呆老外，网友：宣传部加鸡腿！

3 天前

精明常旅客 · 携程换东航加赠200%！4000分换600东航！冲！

3 天前

FM93交通之声 · 浙江女子肠胃不舒服，一检查蒙了！医生：严重可达上千条……

6 月前

中国畜牧业协会家禽业 · 鸡卵巢循环卵泡补充与排卵的关系

5 月前

飞客区块链 · 浙江本土豪华酒店天花板？

2 月前

娱乐硬糖 · 青年戏越少，年代剧越好？

1 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号