Alignment下一站：合成数据

李rumor · 公众号 · · 2024-08-14 09:18

文章预览

卷友们好，我是rumor。大模型训练中，数据质量已经是所有人的共识了。在23年开始接触Alignment之后，我一直是人工标注流派，深信InstructGPT [1] 中所描述的，先train好标注员，再train好模型。那时候各个模型的质量也都一般，合成的数据一眼就能挑到一堆毛病。事情的转折要从sora开始，了解到那么好的效果居然大量应用了合成数据之后，我开始意识到自己还停留在上一个时代。首先大模型的能力是一直在提升的，去年还被狂吹的GPT3.5现在已经被甩了几条街了，大模型在很多任务上都可以达到人类标注员的水平；其次在大模型时代，应该多去发掘模型的价值，学会和AI协作，而不是上来就先验地觉得模型生成的数据质量不过关。随着业内模型能力和使用熟练度的整体提升，今年数据合成的工作一波又一波，数据合成的前景非常客观：合成Prompt：GPT系 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

禽报网 · 冷库及车间破损地坪快速修复材料来啦！双汇、正大、金锣等都在用！

16 小时前

Hacking黑白红 · 腾讯招聘7000人

2 天前

安全学习那些事儿 · Meta因泄露公司机密解雇约20名员工

3 天前

安全学习那些事儿 · Meta因泄露公司机密解雇约20名员工

3 天前

禽报网 · 冻品•3-1\\这段爪类就没雄起，一直跌；翅类局部再显弱走跌！

3 天前

财联社AI daily · 蚂蚁集团，拆分13薪！

3 天前

财联社AI daily · 蚂蚁集团，拆分13薪！

3 天前

测序录 BioTrace · 这一次，科学家被IT男偷了家

3 月前

常岩CY · 特斯拉的行为艺术之二。他们在 Giga Texas 的 Cybe-20241207161354

2 月前

云南警方 · 真暖！热带雨林有个“波懋阔扯”

1 月前

云南警方 · 真暖！热带雨林有个“波懋阔扯”

1 月前