专栏名称: 人工智能AI大模型与汽车自动驾驶

手机：16601807362，可咨询购买自动驾驶开发套件、自动驾驶教学平台及解决方案、线控底盘、Mobileye相机、德尔福和博世4D雷达、激光雷达。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

相关文章推荐

AI范儿 · Llama 4 是开源模型的全面倒退？ · 2 天前

938重庆私家车广播 · 微信“大幅更新”！朋友圈功能升级了 · 2 天前

陕西交通广播 · 微信“大幅更新”！ · 2 天前

网信浙江 · 精准、全链条打击网信办重拳整治体育“饭圈”乱象 · 3 天前

连州点点网 · 清明假期返程，高速路上需要它→ · 3 天前

今天看啥 › 专栏 › 人工智能AI大模型与汽车自动驾驶

量化大模型的高效微调方法：QLoRA

人工智能AI大模型与汽车自动驾驶 · 公众号 · · 2024-07-26 13:03

文章预览

论文标题： QLoRA: Efficient Finetuning of Quantized LLMs 论文作者： Tim Dettmers, Artidoro Pagnoni, Ari Holtzman, Luke Zettlemoyer 项目地址: https://github.com/artidoro/qlora 笔者: 曼城周杰伦审核：Los 导读： QLoRA是来自华盛顿大学的Tim Dettmers大神提出的模型量化算法，应用于LLM训练，降低显存需求，其足以在单个48GB显存的GPU上对65B进行微调，同时能保持16位全量微调的效果。其核心是在LoRA的基础上作出优化： 1）新定义了一种4位标准浮点数NF4的最优数据类型； 2）双重量化，对普通参数和量化常数分别量化，进一步减少缓存占用； 3）分页优化器，在显存过高时以部分内存替代显存。通过上述三种核心机制，能够使得原本需要780GB显存才能全量微调65B的模型，现在利用QLoRA仅仅只需要在48G的消费级显卡上就能完成性能接近的微调任务。 ©️【深蓝AI】编译由于QLORA是在LoRA的基 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

AI范儿 · Llama 4 是开源模型的全面倒退？

2 天前

AI范儿 · Llama 4 是开源模型的全面倒退？

2 天前

938重庆私家车广播 · 微信“大幅更新”！朋友圈功能升级了

2 天前

938重庆私家车广播 · 微信“大幅更新”！朋友圈功能升级了

2 天前

陕西交通广播 · 微信“大幅更新”！

2 天前

陕西交通广播 · 微信“大幅更新”！

2 天前

网信浙江 · 精准、全链条打击网信办重拳整治体育“饭圈”乱象

3 天前

连州点点网 · 清明假期返程，高速路上需要它→

3 天前

Morketing · 一个月生成1500万条广告，Meta继续加码AI

5 月前

北京凯盛建材工程有限公司 · 中国二十四节气丨大雪

4 月前

姑苏晚报 · 苏州东站，又有新进展！

3 月前

综合广播看鹤城 · 热情不散，服务不断！“妈妈岗”招聘专场收获满满

1 月前