专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

全量指令微调有害！

AINLP · 公众号 · · 2024-09-28 21:57

文章预览

知乎：楠楠楠楠x 链接：https://zhuanlan.zhihu.com/p/721870518 https://openreview.net/forum?id=XkHJo8iXGQ 本文介绍一篇相当有意思的文章，该文章的内容对我们使用指令微调将预训练模型改造为chat模型和下游专业模型相当有指导意义。本文的标题听起来有些唬人，有些标题党，但是这个论点在一定的限定条件下是成立的，笔者归纳为：对充分预训练的模型使用通用指令微调数据集进行全量微调有害。一. LoRA指令微调并不能学习知识，但它很优秀试图使用指令微调来为模型灌输知识，其实是一个很常见的做法。然而只要这样做过的人会发现，效果并不会特别好，特别是使用LoRA训练时，模型几乎学不到任何知识。笔者自己的实践是，在使用LoRA对一个Llama3.1本身没有怎么预训练过的内容进行微调时，最终的结果和随机预测基本没有区别（分类和回归任务改造的指令微 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

练瑜伽 · 清华、帝国理工博士研发！薄薄一件T恤，比羊毛衫还暖！

2 天前

练瑜伽 · 还记得被“禁止整容”的小芈月吗？2岁出道年入百万，当红时退圈，如今15岁的她怎样了？

2 天前

练瑜伽 · 比牛仔裤高级，比阔腿裤好看，时髦显腿细的醋酸羊毛直筒裤，上腿就暖，一条过冬！

2 天前

時間的玩家TimeIsArt · 每日临在 | 2024.11.21

4 天前

時間的玩家TimeIsArt · 每日临在 | 2024.11.21

4 天前

海西房产网 · 【公示】曾未批先建！福州软件园两栋建筑最新方案公示

4 月前

一条 · 去非洲搞钱的年轻人，攒下人生第一个100万

1 月前