专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
今天看啥  ›  专栏  ›  黄建同学

如果你还没读过Meta发布Llama3.2 1B和3B的新量化版-20241028223251

黄建同学  · 微博  · AI  · 2024-10-28 22:32

文章预览

2024-10-28 22:32 本条微博链接 如果你还没读过Meta发布Llama3.2 1B和3B的新量化版本模型的Blog,建议读一下。可以了解量化模型的基本知识。 #ai# #科技# •相比于其他量化模型,需要在性能和质量之间做取舍,Llama的这款模型实现了性能和质量双提升:可将推理速度提高 2-4 倍,并且平均将模型大小减少 56%,内存占用减少 41%…… 主要得益于使用 LoRA 适配器进行量化感知训练。 • 使用了两种不同的技术来量化这些模型:使用 Lo ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览