主要观点总结
中国网络空间安全协会人工智能安全治理专业委员会发布了中文互联网基础语料2.0,这是基于前期发布的1.0版本的升级版本。该语料库包含高质量可信数据,规模达到120GB,包含3800万条数据。用户可以通过协会网站下载相关语料。专委会表示将持续加强中文互联网基础语料建设,为人工智能技术创新和产业发展提供支持。发布仪式上有来自专委会成员、大模型备案机构和相关领域的代表参加。
关键观点总结
关键观点1: 中文互联网基础语料2.0的发布
该语料库是在中央网信办指导下,由中国网络空间安全协会和国家互联网应急中心共同发布,是对中文互联网基础语料1.0的升级。语料库包含高质量可信数据,规模达到120GB,包含3800万条数据。
关键观点2: 语料库的共建共享机制
依托专委会建立的语料共建共享机制,汇聚了一批新的高质量可信数据,经过严格的数据加工处理措施形成中文互联网基础语料2.0。
关键观点3: 用户如何获取语料
用户可以通过登录中国网络空间安全协会网站,点击“中文互联网语料资源平台”链接,通过注册、认证等程序,即可下载相关语料。
关键观点4: 专委会的未来计划
网安协会人工智能安全治理专委会表示将持续加强中文互联网基础语料建设,为人工智能技术创新和产业发展提供有力支撑和保障。
文章预览
1月9日,在北京召开的中国网络空间安全协会人工智能安全治理专业委员会工作年会上,中文互联网基础语料2.0正式向社会发布。 在中央网信办指导下,中国网络空间安全协会会同国家互联网应急中心,在前期发布中文互联网基础语料1.0的基础上,持续发挥企业、高校和科研单位协同优势,依托专委会建立的语料共建共享机制,汇聚一批新的高质量可信数据,经过信源筛选、内容过滤、数据去重等一系列严格细致的数据加工处理措施,形成并对社会发布中文互联网基础语料2.0,规模120GB,数据3800万条。用户登录中国网络空间安全协会网站(https://www.cybersac.cn/newhome),点击“中文互联网语料资源平台”链接,通过注册、认证等程序,即可下载相关语料。 网安协会人工智能安全治理专委会负责人表示,数据是发展人工智能的基础关键资源,中文互联
………………………………