专栏名称: Founder Park
来自极客公园,专注与科技创业者聊「真问题」。
目录
相关文章推荐
今天看啥  ›  专栏  ›  Founder Park

Nature 重磅论文:用 AI 生成的数据训练 AI,会让大模型崩溃

Founder Park  · 公众号  ·  · 2024-07-25 21:23

文章预览

文章转载自「新智元」。 我们知道,训练大模型需要大量的数据积累,随着技术的发展,高质量数据逐渐 成为AI进步的强烈需求。 面对这样的情况下,为了提升模型能力,人们开始使用AI生成的数据返回再次训练AI,并没有怀疑这种行为是否会出现问题。 不过,最新研究发现,用 AI 生成的数据训练 AI,模型可能会崩溃。 牛津、剑桥、帝国理工、多伦多大学等机构的这篇论文,今天登上了 Nature 封面。 如果放任大模型用自动生成的 数据训练自己,AI 可能会自我退化,在短短几代内将原始内容迭代成无法挽回的胡言乱语。 如今,LLM 已经强势入侵了人类的互联网,极大地改变了在线文本和图像的生态系统。 如果网络上的大部分文本都是 AI 生成的,我们用网络数据训练出的 GPT-n,会发生什么? 研究者发现,如果在训练中不加区别地使用 AI 产生的内容 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览