今天看啥  ›  专栏  ›  CNS导读

Nature | 新方法给AI产出 “打水印”

CNS导读  · 公众号  ·  · 2024-10-24 23:59

文章预览

Google DeepMind刚刚在Nature发表文章,介绍新方法-SynthID-Text给大模型产生的文本 “打水印” ,帮助人们识别,从而更安全负责地使用大模型[1], [2]。 该“打水印”的原理是在文本生成的时候引入细微的修饰,从而产生统计特征;这种特征就可以后续低计算负担地被检测出来[1]。 进一步研究人员通过与其它类似方案的比较展示了该方法的高检测准确率和低文本质量影响[1]。 研究人员认为该方法的局限是:1. 需要大模型开发端的配合;2.“水印系统” 容易受攻击或者被戏弄[3];3. “水印”比较容易通过深度的润色绕过去。所以SynthID-Text需要和其它方法配合[1]。 该项工作的通讯作者是来自 Google DeepMind 的Pushmeet Kohli和Sumanth Dathathri;2024年10月23日发表在Nature[1]。 Comment(s): 很重要的工作,毕竟关系信息生态系统。 文中关于SynthID-Text在多语言表现比较的数据很 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览