专栏名称: 程序员好物馆
成就一亿技术人
今天看啥  ›  专栏  ›  程序员好物馆

Meta被曝AI训练「黑幕」!下载81.7TB盗版数据“喂养”模型,CEO竟称不知情?

程序员好物馆  · 公众号  ·  · 2025-02-11 09:00
    

文章预览

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 作为全球知名的科技公司之一,Meta 在 AI 领域的进展一直备受关注。然而,近日一系列曝光的邮件和法庭文件将 Meta 推到了风口浪尖: 根据最新披露的信息 ,Meta 明知使用 LibGen 和 Z-Library 数据库可能会涉及盗版行为,还通过种子下载(torrenting)方式获取了至少 81.7 TB 的盗版数据,并刻意隐瞒这种行为。 81.7TB, 盗版数据规模惊人 据悉,这场法律纠纷始于 2023 年一群书籍作者对 Meta 的起诉,他们指控 Meta 非法使用从 LibGen 和 Z-Library 等网站获取的数据训练其 AI 模型。简要介绍一 下 LibGen 和 Z-Library:二者都是“影子图书馆”,即网站上大多都以侵犯版权的方式向人们提供学术文献内容和小说等。 上个月,Meta 就已承认从 LibGen 下载了一个大型数据集,该数据集包含数千万本盗版书籍。但关于下载的细节一直模糊 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览