主要观点总结
中国科学技术大学认知智能全国重点实验室的陈恩红教授团队在西班牙巴塞罗那召开的第30届ACM知识发现与数据挖掘大会上发表了一篇名为“Dataset Regeneration for Sequential Recommendation”的论文,并荣获大会Research Track唯一最佳学生论文奖。该论文提出了一种新的以数据为中心的范式——用于序列推荐的数据集重生成(DR4SR),旨在解决序列推荐系统中的数据质量问题和缺陷。研究团队的创新性方法包括构建预训练任务、提出多样性增强的重生成器以及混合推理策略等。
关键观点总结
关键观点1: 研究背景
序列推荐系统是现代推荐系统的重要组成部分,旨在捕捉用户不断变化的偏好。为了增强序列推荐系统的能力,研究者已经付出了大量努力,但传统方法往往忽视了数据中潜在的质量问题和缺陷。
关键观点2: 研究动机
为了解决这些问题,学界提出了以数据为中心的范式,重点在于使用固定模型转而生成高质量的数据集。研究团队将这一过程定义为数据集重生成,并提出了用于序列推荐的数据集重生成(DR4SR)这一新颖的以数据为中心的框架。
关键观点3: 主要工作
研究团队首先构建了预训练任务,使得数据集重生成成为可能。接着,他们提出了一种多样性增强的重生成器,以在重生成过程中建模序列和模式之间的一对多关系。最后,他们提出了一种混合推理策略,以在探索与利用之间取得平衡,生成新的数据集。此外,为了满足特定目标模型的需求,研究团队还提出了模型感知的数据集重生成方法。
关键观点4: 实验结论
实验结果表明,DR4SR能够重生成一个信息丰富且具有普遍适用性的数据集。不同的目标模型偏好不同的数据集,而去噪只是数据重生成问题的一个子集。
关键观点5: 投稿通道
PaperWeekly平台鼓励分享各类优质内容,包括最新论文解读、学术热点剖析等。稿件要求原创且未曾在公开渠道发表。投稿邮箱为hr@paperweekly.site,也可以直接添加小编微信(pwbot02)快速投稿。
文章预览
©作者 | 陈恩红团队 来源 | 机器之心 8 月 25 日 - 29 日在西班牙巴塞罗那召开的第 30 届 ACM 知识发现与数据挖掘大会 (KDD2024) 上,中国科学技术大学认知智能全国重点实验室陈恩红教授、IEEE Fellow,和华为诺亚联合发表的论文 “Dataset Regeneration for Sequential Recommendation”,获 2024 年大会 Research Track 唯一最佳学生论文奖。 论文第一作者为中科大认知智能全国重点实验室陈恩红教授,连德富教授,与王皓特任副研究员共同指导的博士生尹铭佳同学,华为诺亚刘勇、郭威研究员也参与了论文的相关工作。这是自 KDD 于 2004 年设立该奖项以来,陈恩红教授团队的学生第二次荣获该奖项。 文章地址: https://arxiv.org/abs/2405.17795 开源代码: https://github.com/USTC-StarTeam/DR4SR 研究动机 序列推荐系统(Sequential Recommender, SR)是现代推荐系统的重要组成部分,因为它旨在捕
………………………………