全量指令微调有害！

包包算法笔记 · 公众号 · · 2024-09-26 10:10

文章预览

知乎：楠楠楠楠x 链接：https://zhuanlan.zhihu.com/p/721870518 https://openreview.net/forum?id=XkHJo8iXGQ 本文介绍一篇相当有意思的文章，该文章的内容对我们使用指令微调将预训练模型改造为chat模型和下游专业模型相当有指导意义。本文的标题听起来有些唬人，有些标题党，但是这个论点在一定的限定条件下是成立的，笔者归纳为：对充分预训练的模型使用通用指令微调数据集进行全量微调有害。一. LoRA指令微调并不能学习知识，但它很优秀试图使用指令微调来为模型灌输知识，其实是一个很常见的做法。然而只要这样做过的人会发现，效果并不会特别好，特别是使用LoRA训练时，模型几乎学不到任何知识。笔者自己的实践是，在使用LoRA对一个Llama3.1本身没有怎么预训练过的内容进行微调时，最终的结果和随机预测基本没有区别（分类和回归任务改造的指令微 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

发现新西兰 · 新西兰“奢华龙虾宴”竟是非法！每位费用4650-7750纽币

4 天前

红秀GRAZIA · 摩羯座满月遇上火星进入双子座，吹响变动的号角

4 月前

教师E家 · 别“逼”孩子努力了！越是普通的孩子，越早铺好这条路，10年后越有出息

3 月前

教师E家 · 别“逼”孩子努力了！越是普通的孩子，越早铺好这条路，10年后越有出息

3 月前

上海华略智库 · 夏骥院长为民盟嘉兴市委会作专题授课

2 月前

Dada Bar Beijing · 周五10月4日 - 『主厨推荐』台北音乐精灵🧚 Cai，带来浩室融合之声 @ Dada Beijing

1 月前