AI生成的数据，竟成为一枚射向自己的子弹？| 追问Data

追问nextquestion · 公众号 · · 2024-10-15 17:42

文章预览

AI生成的文字和图片，正日渐充斥于互联网中。 OpenAI首席执行官Sam Altman在今年2月份表示，该公司每天生成大约1000亿个单词——相当于每天一百万本小说的文本量，其中有多少内容最终流入了互联网还未可知 [1] 。 AI生成文本，可能出现在餐厅评论、约会资料或社交媒体帖子中，也可能以新闻文章的形式出现——NewsGuard [2] ，一个专门追踪网络虚假信息的机构，最近识别出超过一千个大量生产漏洞百出的AI生成的新闻文章的网站 [3] 。实际上，由于缺乏有效的检测方法，此类内容许多仍未被发现。所有这些AI生成的信息,不仅让我们难辨真假，也给AI公司制造了麻烦。通过浏览网页的方式以获取训练下一代模型的新数据，将变得日益艰难 [4] 。一些自身生成的AI内容，很可能会被吸纳，从而无意中形成闭环，即某一代AI的输出变成了另一代的输入。从长 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博