专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

微调数据指令复杂度论文分享

AINLP · 公众号 · · 2024-09-19 17:39

文章预览

WizardLM: Empowering Large Language Models to Follow Complex Instructions 一种数据进化的方式，通过人工调试出的特殊指令来构造更加多样且难度增加的数据。2种数据多样性生成方法分别是： Prompts of In-Depth Evolving. 将原来的指令变得更加复杂和困难； Prompts of In-Breadth Evolving. 增加指令数据覆盖的领域，增加整体数据集的指令多样性；有趣的是，文中在每一轮生成数据是，在同一个指令上面使用5次In-Depth和1次的In-Breadth，论文中没有提及太多原因，但感觉可能和2种生成方法的成功率有关。上述生成的指令，进而使用chatGPT得到对应指令的答案。最后一步是对上述生成指令和对应答案进行筛选，方法如下：使用chatGPT判断2条指令是否在内容上完全一样，即是否有信息增量；因为进化的随机性，有一定可能模型无法给出有效的答案，这部分用规则检测模型回复过滤； ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

挑圈联靠 · 清晨喝咖啡危害大！最新研究揭示糖尿病患者生存率与饮茶时机的秘密

21 小时前

挑圈联靠 · 清晨喝咖啡危害大！最新研究揭示糖尿病患者生存率与饮茶时机的秘密

21 小时前

学习强国 · 老人摔跤之后无症状就安全了？这种情况要警惕！

2 天前

学习强国 · 手脚冰凉怎么办？快转给你那个手脚冰凉的朋友

6 天前

学习强国 · 手脚冰凉怎么办？快转给你那个手脚冰凉的朋友

6 天前

杨天南财务健康谈 · 每月公益推荐：首都人民的理发师

6 天前

船客 · 南部非洲｜体验奥卡万戈独木舟

4 月前

小胖看房二手房 · 粉丝房源无中介！黄浦蓬莱公园中福浦江汇96.62平2房1250万

3 月前