一文彻底搞懂Fine-tuning - 参数高效微调（Parameter-Efficient Fine-Tuning）

架构师带你玩转AI · 公众号 · · 2024-08-04 22:12

主要观点总结

本文主要介绍了Parameter-Efficient Fine-Tuning（PEFT）技术及其在NLP任务中的应用。PEFT是一种在保持预训练模型大部分参数不变的情况下，通过仅调整少量额外参数来适应新任务的技术。文章详细介绍了PEFT的三种主要方法：Prefix Tuning、LoRA和Adapter Tuning。

关键观点总结

关键观点1: PEFT技术概述

PEFT是一种高效的模型微调技术，能够在保持预训练模型大部分参数不变的情况下，通过调整少量额外参数来适应新任务。

关键观点2: Prefix Tuning

Prefix Tuning通过在模型输入层添加可训练的前缀嵌入来影响模型的输出。前缀嵌入与原始输入拼接后一起输入到模型中。对于Transformer模型，可以通过添加前缀嵌入来实现问答、文本分类等自然语言处理任务。

关键观点3: LoRA（Low-Rank Adaptation）

LoRA基于预训练模型具有较低的内在维度的假设，通过在预训练模型中引入一个额外的线性层（由低秩矩阵组成），并使用特定任务的训练数据来微调这个线性层。LoRA涉及低秩矩阵、缩放系数、Dropout系数和学习率等参数，它们共同影响模型微调的效果和效率。

关键观点4: Adapter Tuning

Adapter Tuning通过在预训练模型的中间层中插入小的可训练层或“适配器”来提高模型在特定任务上的表现。适配器通常包括输入层、输出层、可能的下投影和上投影前馈层以及非线性激活函数等。在训练过程中，仅训练这些适配器模块的参数，以微调模型，同时保持预训练模型参数不变。

文章预览

Parameter-Efficient Fine-Tuning PEFT（Parameter-Efficient Fine-Tuning）是一种在保持预训练模型大部分参数不变的情况下，通过仅调整少量额外参数来适应新任务的技术。这些额外参数可以是新添加的嵌入层、低秩矩阵或其他类型的参数，它们被用来“引导”或“调整”预训练模型的输出，以使其更适合新任务。 Parameter-Efficient Fine-Tuning PEFT的主要方法包括 Prefix Tuning（在模型输入层添加可训练的前缀嵌入），LoRA（通过低秩矩阵近似模型参数更新），以及Adapter Tuning（在模型层间插入小型神经网络adapters）。 Parameter-Efficient Fine-Tuning Prefix Tuning Prefix Tuning通过在模型输入层之前添加可训练的前缀嵌入（prefix embeddings）来影响模型的输出。这些前缀嵌入与原始输入拼接后一起输入到模型中，而模型的其他部分保持不变。 LoRA （Low-Rank Adaptation） LoRA通过在原始模型权重矩 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博