文章预览
1. 摘要 本文是汉堡数据保护和信息自由专员发布的关于大型语言模型(LLMs)与个人数据的讨论文件。文件的核心目的是探讨通用数据保护条例(GDPR)对LLMs的适用性,并对公司和机构在数据保护法律问题上提供指导。文章首先阐明了AI系统与LLMs的区别,并深入讨论了LLMs的工作原理,特别是Token化过程和信息存储方式。接着,文章分析了LLMs在处理个人数据时的法律地位,以及它们在训练过程中使用个人数据的合法性问题。文章最终提出了三个基本论点,并探讨了这些论点对实践的影响。 I. 引言 引言部分提出了LLMs在处理提示(Prompts)时可能会输出包含个人数据的信息,这引发了LLMs是否存储个人数据的问题。文章强调了区分AI系统和LLMs的重要性,并以Chatbots为例,说明了用户输入在LLMs处理之前的处理流程。 II. LLMs的技术评估 Token作为信息处理的基础
………………………………