AI训AI惨遭投毒9次大崩溃，牛津剑桥等惊天发现登Nature封面！

硅星人Pro · 公众号 · 科技媒体 · 2024-07-26 11:11

文章预览

文章转载于新智元用AI生成的数据训练AI，模型会崩溃？牛津、剑桥、帝国理工、多伦多大学等机构的这篇论文，今天登上了Nature封面。如今，LLM已经强势入侵了人类的互联网，极大地改变了在线文本和图像的生态系统。如果网络上的大部分文本都是AI生成的，我们用网络数据训练出的GPT-n，会发生什么？论文地址：https://www.nature.com/articles/s41586-024-07566-y 研究者发现，如果在训练中不加区别地使用AI产生的内容，模型就会出现不可逆转的缺陷——原始内容分布的尾部（低概率事件）会消失！这种效应，被称为「模型崩溃」。换句话说，合成数据就像是近亲繁殖，会产生质量低劣的后代。模型崩溃在LLM、变分自编码器VAE和高斯混合模型GMM中，都可能会发生。有网友认为，是时候敲响警钟了！「如果大模型真的在AI生内容的重压下崩溃，这对它们的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

ZEALER · 隐私和便利真的难兼得？鸿蒙NEXT：我全都要

2 天前

雷科技 · 余承东放话！华为最猛旗舰定了

3 天前

新浪科技 · #常山北明上演地天板#【罕见，#一天6个地天板#】11月4日，A-20241104161000

3 天前

新浪科技 · 【#三只羊已缴清罚款#】11月2日，针对日前关于合肥三只羊网络科-20241102124330

5 天前

新浪科技 · 【#巨头押注500亿美元满足AI能源需求#】华尔街巨头将在人工智-20241031223652

1 周前

中国能建 · 开工！世界首条！

3 月前

亿邦动力 · 京东百亿补贴调整！30亿追投美妆品类；得物将精简约5%人员；资生堂集团上半年经营亏损27亿日元丨CEO自习室

3 月前

智能光伏 · 中国新能源产业总裁班（舒印彪，李想，高纪凡，史玉波）

3 周前