文章预览
本文整理自Nature于2024年8月14日发布的一则新闻报道,原文题目为“Has your paper been used
to train an AI model? Almost certainly”。 学术出版商正在向科技公司出售研究论文的访问权,以训练人工智能(AI)模型 。一些研究者对这种未经作者同意进行的交易而感到愤怒。 专家表示, 如果一篇论文尚未被用于训练大型语言模型(LLMs),那么也可能很快就会被使用了 。研究者正在探索技术方法,让作者能识别其内容是否被用于训练。 上个月,英国出版商Taylor & Francis与微软签署了一项价值1000万美元的协议,允许其访问该出版商的数据以改进AI系统。2024年6月, 美国出版商Wiley允许一家不知名公司使用其内容训练生成式AI模型,由此赚取了2300万美元 。 华盛顿大学的AI研究员Lucy Lu Wang表示,无论是否储存在开放获取库中,任何可在线阅读的内容“均可能”被LLMs用
………………………………