注册
登录
专栏名称:
瓦力算法学研所
我们是一个致力于分享人工智能、机器学习和数据科学方面理论与应用知识的公众号。我们将分享最新的人工智能和数据科学技术、案例、研究成果、新闻和趋势,以及如何应用这些技术来解决实际问题,探索每一项技术落地的可行性方案。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
目录
相关文章推荐
新北方
·
最新预报,雨雪午后到!
·
昨天
今天看啥
›
专栏
›
瓦力算法学研所
大模型微调方法之QLoRA
瓦力算法学研所
·
公众号
· · 2024-10-06 20:43
文章预览
技术总结专栏 本文介绍大模型微调方法中的QLoRA。 QLoRA由华盛顿大学UW NLP小组的成员于2023年提出发,旨在进一步降低微调大模型的微调成本,因为对于上百亿参数量的模型,LoRA微调的成本还是很高。 感兴趣的小伙伴可以去阅读一下原文:https://arxiv.org/pdf/2305.14314 模型介绍 上图为QLoRA的训练过程图,QLoRA更多的是在工程上进行了量化和优化,从图中可知,主要有4个部分的改进: QLORA: 是一种优化的4-bit量化数据类型,专为正态分布权重设计,通过结合低精度存储和中等精度计算来提升模型性能。它使用4-bit存储权重以减少内存使用,并在计算时将权重转换为16-bit的BFloat16格式以保持准确性。这种方法适用于模型加载和训练过程,旨在平衡存储效率和计算精度。 Double Quantization: 是一种模型量化技术,它通过对已经量化过的常量进行二次量化,进一步 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
新北方
·
最新预报,雨雪午后到!
昨天
爱可可-爱生活
·
ihower:Apple Intelligence 貌似由三个大-20240612083526
9 月前
季顺潘
·
M7Q测试:潜意识,你的伴侣希望你调整的态度是什么?
9 月前
唧唧堂
·
MS:人工智能帮助筛选创意
9 月前
赵皓阳-Moonfans
·
开启赏秋之旅:承德——北京——南京——无锡——苏州——杭州[吃馕-20241019174238
5 月前