文章预览
点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! AITIME 01 讲者信息 张伟超 中国科学院计算技术研究所博士生 中国科学院计算技术研究所博士生张伟超(导师:郭嘉丰研究员),主要研究方向为大模型安全相关,他作为第一作者的论文 Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method(大语言模型的预训练数据检测: 基于散度的校准方法)获得EMNLP 2024大会最佳论文奖(Best Paper Award)。 EMNLP 2024大会最佳论文奖(Best Paper Award) AITIME 02 论文简介 近年来,大语言模型(LLMs)的训练数据规模在不断扩大,而模型开发者却越来越不愿意公开训练数据的使用信息,这种情况使得审查大模型的数据使用过程是否符合法律法规面临困难。近期,在大模型上进行预训练数据检测的任务开始受到关注,即给定一段文本和一个预训练数据未
………………………………