今天看啥  ›  专栏  ›  追问nextquestion

AI生成的数据,竟成为一枚射向自己的子弹?| 追问Data

追问nextquestion  · 公众号  ·  · 2024-10-15 17:42
    

文章预览

AI生成的文字和图片,正日渐充斥于互联网中。 OpenAI首席执行官Sam Altman在今年2月份表示,该公司每天生成大约1000亿个单词——相当于每天一百万本小说的文本量,其中有多少内容最终流入了互联网还未可知 [1] 。 AI生成文本,可能出现在餐厅评论、约会资料或社交媒体帖子中,也可能以新闻文章的形式出现——NewsGuard [2] ,一个专门追踪网络虚假信息的机构,最近识别出超过一千个大量生产漏洞百出的AI生成的新闻文章的网站 [3] 。 实际上,由于缺乏有效的检测方法,此类内容许多仍未被发现。 所有这些AI生成的信息,不仅让我们难辨真假,也给AI公司制造了麻烦。通过浏览网页的方式以获取训练下一代模型的新数据,将变得日益艰难 [4] 。一些自身生成的AI内容,很可能会被吸纳,从而无意中形成闭环,即某一代AI的输出变成了另一代的输入。 从长 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览