专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

LoRA、完全微调到底有何不同?MIT 21页论文讲明白了

数据派THU  · 公众号  · 大数据  · 2024-11-22 17:09

文章预览

来源:机器之心 本文 约2500字 ,建议阅读 5分钟 本文旨在了解两种微调大型语言模型方法之间的差异:完全微调和低秩自适应 (LoRA)。 本文旨在了解两种微调大型语言模型方法之间的差异:完全微调和低秩自适应 (LoRA)。这两种方法都用于将预训练模型适应特定的下游任务,但它们却有所不同。 微调(Fine-tuning)是将经过预训练的大语言模型应用于下游任务的关键范例。最近,低秩自适应 (LoRA) 等方法已被证明可以在各种任务上达到完全微调模型的性能,同时可训练参数的数量却大大减少。 这就提出一个问题,即它们学到的解决方案真的等效吗? 带着这一疑问,来自 MIT 的研究者在论文《 LORA VS FULL FINE-TUNING: AN ILLUSION OF EQUIVALENCE 》中进行了深入探讨。 论文地址: https://arxiv.org/pdf/2410.21228v1 作者通过分析预训练模型权重矩阵的光谱特性来研究不同的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览