专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

详解LLM参数高效微调：从Adpter、PrefixTuning到LoRA

AINLP · 公众号 · · 2024-06-24 10:10

文章预览

作者：LeonYi，四川大学计算机技术硕士声明：本文只做分享，版权归原作者来源：青稞AI 原文：https://zhuanlan.zhihu.com/p/696057719 一、背景 1.1 Transformer结构 Basic Transformer block 自注意力模块 1.2 指令微调在大量通用数据上进行预训练语言模型训练，然后再针对特定下游任务进行微调，达到领域适应（迁移学习）的目的。是NLP目前的主流范式。指令微调在预训练语言模型微调的基础进行优化，其目的是尽量让下游任务的形式尽量接近预训练任务。从而减少下游任务和预训练任务之间的Gap, 实现预训练语言模型适应下游任务，而非下游任务去适应模型指令微调的效果要优于基于Zero/Few-shot的提示词工程的上下文学习。但随着预训练语言模型进入LLM时代，其参数量愈发庞大。全量微调模型所有参数所需的显存早已水涨船高。例如：全参微调Qwen2-7B预估要2 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

中国妇女 · “乒乓奶奶”倪夏莲宣布第7次冲击奥运会，届时将年满64岁

昨天

中国妇女 · “乒乓奶奶”倪夏莲宣布第7次冲击奥运会，届时将年满64岁

昨天

小齐的公考常识 · 【开奖啦】上周公众号时政、常识打卡活动中奖名单

10 月前

硬蛋 · 倒计时3天｜2024英特尔&科通合作伙伴行业峰会，即将启幕！

9 月前

人力资源分享汇 · 做到这16点，人力成本下降30%

4 月前

中国铁建 · 见证历史！中国最大沙漠被“包围”了

4 月前