专栏名称: TMT法律论坛

聚焦数据合规、网络安全、GDPR、大数据、Fintech、人工智能、自动驾驶与电子商务等TMT领域的前沿法律实务，由中伦TMT团队运营，合作与沟通：DataLaw.pg@zhonglun.com。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

GEN AI 合规 FAQs（二） | 如何合规地建立大模型预训练数据集？

TMT法律论坛 · 公众号 · 互联网安全科技自媒体 · 2024-09-05 17:30

主要观点总结

文章介绍了关于“GEN AI 合规 FAQs”系列第二期的相关内容，主要围绕大模型训练数据的合规性问题展开。文章提到了训练数据的主要来源和合规使用的重要性，以及针对不同数据来源的合规要点，包括公开数据、开源数据集、采购数据、合成数据、用户输入内容、作品等的使用和合规审查要点。同时，也介绍了训练数据的安全风险和相应的安全要求，以及相关的法律法规要求。

关键观点总结

关键观点1: 大模型训练数据的来源和合规性问题

文章介绍了大模型训练数据的主要来源，包括公开数据、开源数据集、采购数据、合成数据等，并强调了合规使用的重要性。

关键观点2: 不同数据来源的合规要点

文章详细阐述了针对不同数据来源的合规要点，包括公开数据的爬取、开源数据集的合规审查、采购数据的合规审查等。

关键观点3: 训练数据的安全风险和相应安全要求

文章指出了训练数据的安全风险，包括包含违反社会主义核心价值观的内容等，并介绍了相应的安全要求。

关键观点4: 相关法律法规要求

文章提到了相关的法律法规要求，如《生成式人工智能服务管理暂行办法》等，并强调了合规的重要性。

文章预览

欢迎点击上方 TMT法律论坛关注我们专栏 GEN AI ★ 导读 ★ 自Open AI掀起生成式人工智能的狂潮以来，大模型在各行各业的应用日益广泛，成为推动企业创新与新质生产力发展的重要力量。与此同时，合规挑战亦如影随形。在此背景下，我们推出系列“ GEN AI 合规 FAQs ”。每期，我们都将聚焦企业应用Gen AI相关的核心话题，从产品备案到训练数据集构建，从电信业务许可到内容安全管理，从数据安全保护到知识产权风险应对……全方位覆盖不同合规领域及应用场景，以期帮助Gen AI应用企业妥善应对潜在的法律风险。本期为"GEN AI 合规 FAQs"第二期 “如何合规地建立大模型预训练数据集？” 注：专栏配图均由AI生成训练数据的数量、质量、多样性是构建大模型能力的关键性因素，同时法律层面上对于训练数据的合规性也有所要求，因此如何合规、 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

内蒙古掌上12348 · 微信上线新功能！网友：太方便了

昨天

内蒙古掌上12348 · 微信上线新功能！网友：太方便了

昨天

掌上铜山 · 明确了！事关人脸识别技术，6月1日起施行

2 天前

掌上铜山 · 明确了！事关人脸识别技术，6月1日起施行

2 天前

能源电力说 · 刚刚！国内最大300MWh用户侧储能项目开工

2 天前

能源电力说 · 刚刚！国内最大300MWh用户侧储能项目开工

2 天前

惠济发布 · 事关人脸识别，两部门联合发文！

2 天前

惠济发布 · 事关人脸识别，两部门联合发文！

2 天前

北京日报 · 殷勇会见英国阿斯利康公司全球首席执行官

3 天前

北京日报 · 殷勇会见英国阿斯利康公司全球首席执行官

3 天前

美妆产品观 · 净利大增526%，联合利华代工厂扭亏为盈

7 月前

参考消息 · 践诺于行，院士领衔！胡姬花全球花生产业研究院食安科研项目实践落地！

6 月前

圆圆的算法笔记 · AAAI'25 | 时序预测新视角：将时序预测问题转换为层次分类任务增强特征多样性

2 月前

上海市司法局 · 上海市爱心帮教基金会2024年度总结大会召开

2 月前

南方新闻网 · 8车28.5万元！男孩扔鞭炮“炸翻”多车，最新公布→

1 月前