专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

微调数据工程入门论文合集

AINLP · 公众号 · · 2024-09-24 22:07

文章预览

目录：质量>数量 LIMA: Less Is More for Alignment 什么是SFT数据质量指令数据复杂度 WizardLM: Empowering Large Language Models to Follow Complex Instructions Tree-Instruct: A Preliminary Study of the Intrinsic Relationship between Complexity and Alignment 指令数据多样性数据筛选方法-Influence Formulation系列 Estimating Training Data Influence by Tracing Gradient Descent LESS: Selecting Influential Data for Targeted Instruction Tuning 数据筛选-实用主义方法基于多样性的方法-InsTAG 基于样本复杂度的方法-IDF 基于ICL的方法质量>数量 LIMA: Less Is More for Alignment 主要观点：大模型的所有知识都是通过预训练阶段获得的，只需要很少的指令微调数据就可以获得高质量的输出。凸出了预训练的重要性，并倡导在做微调阶段更加重视数据多样性，而不是简单的扩大数据规模。数据生成过程基于论文的主要观点，文中构造了1000个问答对 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博