文章预览
夕小瑶科技说 分享 来源 | 量子位 刚刚,EMNLP 2024 最佳论文 奖新鲜出炉! 5篇中榜论文中,华人学者参与三篇,分别来自CMU、上海交通大学、中国科学院大学等机构。 其中,Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method主要由中科院网络数据科学与技术重点实验、中国科学院大学的学者完成。 论文一作Weichao Zhang;通讯作者郭嘉丰,现任中科院网络数据科学与技术重点实验室常务副主任。 这项研究提出了一个新的数据集和方法,用于检测给定文本是否为LLM预训练数据的一部分,有助于提高LLM训练数据透明度。 EMNLP’24今年收录论文总共2978篇,比去年增长5%,其中2455篇主会议论文,523篇workshop论文。 除最佳论文外,杰出论文也揭晓了,超半数华人学者参与。 顺便提一嘴,EMNLP 2025将于明年11月5-9日,在中国苏州举办! 国内学者
………………………………