全参微调与LoRA的区别，及7种LoRA变种方法解析

吃果冻不吐果冻皮 · 公众号 · · 2024-11-06 18:00

文章预览

原文：https://zhuanlan.zhihu.com/p/818782004 1. 前言随着LLM的发展和应用，在LLM的预训练模型基础上做微调，使其适用于自己的业务场景的研究越来越多。与全参数SFT相比LoRA是在冻结LLM本身参数的基础上，在旁路增加两个可学习的矩阵，用于训练和学习，最后推理是LLM输出和可学习的矩阵的输出相加，得到最终的输出。它与全参数微调方法区别是：资源上的差异： • 全参数微调：需要加载和更新全部LLM参数，需要更高的显存（需要的显存一般是单一参数的4倍），数据量上也需要更多的微调数据； • LoRA：只需要加载LLM参数，训练两个可学习的低秩矩阵，显存和数据量要求较低，训练速度也更快; 效果上差异： • 全参数微调：存在灾难性遗忘的风险，理论效果上限更高； • LoRA：和全参数微调效果差距不大，稳定性和扩展性更好； 2. LoRA原理 LoRA低 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

LADYMAX · 14条要闻 | 新CEO能否拯救耐克将迎来关键时刻；勃肯鞋2024财年收入猛涨21%至18亿欧元；开云集团债务压力陡升

3 天前

瞭望智库 · 继承纠纷怎么判？看看最高法发布的典型案例

3 天前

物道 · 这口甜馋了一年：软糯流心，香甜如蜜！

3 天前

政事儿 · 中国过境免签政策全面放宽优化

5 天前

小米公司 · 小米集团2024年Q3业绩：高歌猛进史上最强

1 月前

壹心理 · 金钱的匮乏来自于爱的匮乏

1 周前