专栏名称: 夕小瑶科技说
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
今天看啥  ›  专栏  ›  夕小瑶科技说

多个中国团队斩获EMNLP'24最佳论文!UCLA华人学者中三篇杰出论文

夕小瑶科技说  · 公众号  ·  · 2024-11-15 20:33

文章预览

夕小瑶科技说 分享 来源 | 量子位 刚刚,EMNLP 2024 最佳论文 奖新鲜出炉! 5篇中榜论文中,华人学者参与三篇,分别来自CMU、上海交通大学、中国科学院大学等机构。 其中,Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method主要由中科院网络数据科学与技术重点实验、中国科学院大学的学者完成。 论文一作Weichao Zhang;通讯作者郭嘉丰,现任中科院网络数据科学与技术重点实验室常务副主任。 这项研究提出了一个新的数据集和方法,用于检测给定文本是否为LLM预训练数据的一部分,有助于提高LLM训练数据透明度。 EMNLP’24今年收录论文总共2978篇,比去年增长5%,其中2455篇主会议论文,523篇workshop论文。 除最佳论文外,杰出论文也揭晓了,超半数华人学者参与。 顺便提一嘴,EMNLP 2025将于明年11月5-9日,在中国苏州举办! 国内学者 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览