注册登录

专栏名称: 吃果冻不吐果冻皮

专注于AI工程化（LLM、MLOps、LLMOps、RAG、Agent）落地。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

哲学园 · 雅可比的《斯宾诺莎书信》与德国观念论的形成 · 昨天

哲学园 · 10本世界顶级数学大师教材著作，全是0基础自 ... · 昨天

哲学王 · 海德格尔对世界的警告，今天都变为现实 · 昨天

哲学园 · 施特劳斯如何思考自然科学与政治哲学的关系（骆 ... · 2 天前

今天看啥 › 专栏 › 吃果冻不吐果冻皮

全量指令微调有害！

吃果冻不吐果冻皮 · 公众号 · · 2024-09-29 19:55

文章预览

【点击】加入大模型技术交流群原文： h ttps://zhuanlan.zhihu.com/p/721870518 https://openreview.net/forum?id=XkHJo8iXGQ 本文介绍一篇相当有意思的文章，该文章的内容对我们使用指令微调将预训练模型改造为chat模型和下游专业模型相当有指导意义。本文的标题听起来有些唬人，有些标题党，但是这个论点在一定的限定条件下是成立的，笔者归纳为：对充分预训练的模型使用通用指令微调数据集进行全量微调有害。一. LoRA指令微调并不能学习知识，但它很优秀试图使用指令微调来为模型灌输知识，其实是一个很常见的做法。然而只要这样做过的人会发现，效果并不会特别好，特别是使用LoRA训练时，模型几乎学不到任何知识。笔者自己的实践是，在使用LoRA对一个Llama3.1本身没有怎么预训练过的内容进行微调时，最终的结果和随机预测基本没有区别（分类和回归任 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

哲学园 · 雅可比的《斯宾诺莎书信》与德国观念论的形成

昨天

哲学园 · 10本世界顶级数学大师教材著作，全是0基础自学神器！

昨天

哲学王 · 海德格尔对世界的警告，今天都变为现实

昨天

哲学园 · 施特劳斯如何思考自然科学与政治哲学的关系（骆耕译）

2 天前

财经早餐 · 身体这3个部位疼，你的血管可能已经堵了

3 月前

环保人 · 官方通知：土壤45项参考价格4000。不要再恶性内卷了哦

2 月前

广场恐惧症(微博搜索) · 广场恐惧症(微博搜索)-20241130-1

2 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号