全量指令微调有害！

机器学习算法与自然语言处理 · 公众号 · · 2024-10-04 00:14

文章预览

MLNLP 社区是国内外知名的机器学习与自然语言处理社区，受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。社区的愿景是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进步，特别是初学者同学们的进步。转载自 | 知乎作者 | 楠楠楠楠x https://openreview.net/forum?id=XkHJo8iXGQ 本文介绍一篇相当有意思的文章，该文章的内容对我们使用指令微调将预训练模型改造为chat模型和下游专业模型相当有指导意义。本文的标题听起来有些唬人，有些标题党，但是这个论点在一定的限定条件下是成立的，笔者归纳为：对充分预训练的模型使用通用指令微调数据集进行全量微调有害。 LoRA指令微调并不能学习知识，但它很优秀试图使用指令微调来为模型灌输知识，其实是一个很常见的做法。然而只要这样做过的人会发现，效果并 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

北京大学人文社会科学研究院 · 预告｜【未名学者讲座116】丁雨：潮流的向度：再议11-12世纪中国陶瓷的外销

9 月前

美敦力e站 · 【精砺术野手术秀】付义林——右肺上叶前段切除

8 月前

医药笔记 · 宜联生物：B7H3 ADC启动小细胞肺癌三期临床

5 月前

生态环境科学 · Nature Reviews Earth & Environment｜综述：海洋氮循环——追溯地球的氮循环演化之旅

4 月前