专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
今天看啥  ›  专栏  ›  专知

【AAAI2025】用于互动推荐的对比表示

专知  · 公众号  ·  · 2024-12-28 11:03
    

文章预览

互动推荐(IR)最近因其能够迅速捕捉动态兴趣并优化短期和长期目标而受到广泛关注。IR代理通常通过深度强化学习(DRL)实现,因为DRL本质上与IR的动态特性兼容。然而,DRL目前并不完全适用于IR。由于动作空间庞大和样本效率低下的问题,训练DRL推荐代理是一个挑战。关键问题在于,无法提取有用的特征作为高质量表示,供推荐代理优化其策略。为了解决这个问题,我们提出了用于互动推荐的对比表示(CRIR)。CRIR能够高效地从显式交互中提取潜在的高级偏好排序特征,并利用这些特征来增强用户表示。具体来说,CRIR通过一个表示网络提供表示,并通过我们提出的偏好排序对比学习(PRCL)进行优化。PRCL的关键理念是,它可以在不依赖于涉及高级表示或庞大潜在动作集的计算的情况下进行对比学习。此外,我们还提出了一种数据利用机制和代理 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览