专栏名称: 吃果冻不吐果冻皮

专注于AI工程化（LLM、MLOps、LLMOps、RAG、Agent）落地。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

济宁市公安局济东分局 · 新华鲜报丨交易额增长超九成！“China ... · 昨天

财联社AI daily · DeepSeek爆火后，美国科技巨头面临灵魂拷问！ · 昨天

重庆之声 · 最新丨哪吒，登顶！ · 2 天前

伯虎财经 · 怎么理解万亿小米？ · 3 天前

财联社AI daily · 卖方研究火力全开DeepSeek · 3 天前

今天看啥 › 专栏 › 吃果冻不吐果冻皮

量化方法怎么选？如何评估量化后的大模型LLM？

吃果冻不吐果冻皮 · 公众号 · · 2024-08-06 01:14

文章预览

【点击】加入大模型技术交流群原文：https://zhuanlan.zhihu.com/p/695144724 文章内容总结自：Evaluating Quantized Large Language Models（https://arxiv.org/abs/2402.18158），如果想深入了解量化的基本概念和如何用代码实现请参考：用python代码深入浅出量化概念（https://zhuanlan.zhihu.com/p/696986233）文章总结本文都是针对PTQ如何选择和应用量化技术的建议：评估量化对各种NLP任务的影响评估量化对不同LLMs的影响不同的Tensor类型对量化的影响不同的量化方法对模型的影响根据实验结果的几个关键见解如下：模型越大，对仅权重和KV缓存量化的容忍度越高，而对激活量化的容忍度较低。利用专家混合（MoE）技术增加模型大小并不一定增强模型对量化的容忍度。对于大多数NLP任务，将大多数LLM家族量化为W4、W4A8、KV4和W8KV4，性能损失可以忽略不计（ < 2%）。在一定的内存预 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

济宁市公安局济东分局 · 新华鲜报丨交易额增长超九成！“China Travel”邂逅中国年

昨天

济宁市公安局济东分局 · 新华鲜报丨交易额增长超九成！“China Travel”邂逅中国年

昨天

财联社AI daily · DeepSeek爆火后，美国科技巨头面临灵魂拷问！

昨天

财联社AI daily · DeepSeek爆火后，美国科技巨头面临灵魂拷问！

昨天

重庆之声 · 最新丨哪吒，登顶！

2 天前

重庆之声 · 最新丨哪吒，登顶！

2 天前

伯虎财经 · 怎么理解万亿小米？

3 天前

伯虎财经 · 怎么理解万亿小米？

3 天前

财联社AI daily · 卖方研究火力全开DeepSeek

3 天前

财联社AI daily · 卖方研究火力全开DeepSeek

3 天前

志公教育 · 五险一金，待遇从优，广西百色企事业单位7月人才招聘，招满即止！

6 月前

黄建同学 · #谷歌聊天机器人竟回复称人类去死吧##ai# 确实有这个回复，一-20241119135326

2 月前

香港保险圈 · 一张保单开启双全球化价值！永M多元货币密码4/6/11重磅问世，卷出业界新高度！

2 月前

瞭望东方周刊 · 震后第一晚，救援最新进展

1 月前

话匣子 · 吓skr人！一到深夜就“闹鬼”？上海女子报警后，警方发现又是......

3 周前