专栏名称: 金杜研究院
金杜律师事务所是亚洲地区居于领先地位的综合性律师事务所,专注于为中外客户就各类境内及跨境交易提供全方位的法律解决方案。“金杜研究院”是唯一官方认证账号,致力于成为与您沟通的桥梁并综合展现金杜的专业技能和律所文化。
今天看啥  ›  专栏  ›  金杜研究院

从“不正当竞争”角度思考AI模型训练中“爬虫行为”的违法边界——欧盟与中国之比较

金杜研究院  · 公众号  ·  · 2024-08-06 17:41

文章预览

如您希望下载PDF版本,请点击文末“ 阅读原文 ”获取。 引言 当前,生成式人工智能(generative artificial intelligence,以下简称“ 生成式AI ”)的发展突飞猛进,而此过程需要海量数据的支持,尤其是在模型训练阶段。故而,实践中很多生成式AI模型的训练往往依赖于爬虫工具从互联网上大量爬取数据。 [1] 例如,OpenAI公司的ChatGPT模型曾通过互联网爬取第三方网站中的电子书籍、文章、数据库等570GB、超过3000亿个单词用于训练AI模型。 [2] 然而,在AI模型训练中的爬虫行为如火如荼开展的同时,也需警惕爬虫行为所带来的以下几方面法律风险: (1) 知识产权侵权:当AI公司对第三方网站上受版权保护的内容,如文章、图片、音乐、视频等进行爬取时,可能构成版权侵权; (2) 个人信息侵权:若第三方网站上包含个人信息,如姓名、身份证号、地址、 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览