专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
今天看啥  ›  专栏  ›  机器之心

LoRA、完全微调到底有何不同?MIT 21页论文讲明白了

机器之心  · 公众号  · AI  · 2024-11-11 12:24

文章预览

机器之心报道 编辑:陈陈、小舟 本文旨在了解两种微调大型语言模型方法之间的差异:完全微调和低秩自适应 (LoRA)。这两种方法都用于将预训练模型适应特定的下游任务,但它们却有所不同。 微调(Fine-tuning)是将经过预训练的大语言模型应用于下游任务的关键范例。最近,低秩自适应 (LoRA) 等方法已被证明可以在各种任务上达到完全微调模型的性能,同时可训练参数的数量却大大减少。 这就提出一个问题,即它们学到的解决方案真的等效吗? 带着这一疑问,来自 MIT 的研究者在论文《 LORA VS FULL FINE-TUNING: AN ILLUSION OF EQUIVALENCE 》中进行了深入探讨。 论文地址:https://arxiv.org/pdf/2410.21228v1 作者通过分析预训练模型权重矩阵的光谱特性来研究不同的微调方法如何改变模型。 研究发现,完全微调与 LoRA 产生的权重矩阵奇异值分解结构有显著不同,并且 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览