注册
登录
专栏名称:
专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
金昌市场监管
·
多款药品说明书修订
·
8 小时前
药渡
·
好书推荐丨药明康德译丛《抗癌疗法——从药物发 ...
·
21 小时前
药安食美诚信河北
·
防治流感,国家卫健委点名了这6种药!
·
2 天前
今天看啥
›
专栏
›
专知
【AAAI2025】用于互动推荐的对比表示
专知
·
公众号
· · 2024-12-28 11:03
文章预览
互动推荐(IR)最近因其能够迅速捕捉动态兴趣并优化短期和长期目标而受到广泛关注。IR代理通常通过深度强化学习(DRL)实现,因为DRL本质上与IR的动态特性兼容。然而,DRL目前并不完全适用于IR。由于动作空间庞大和样本效率低下的问题,训练DRL推荐代理是一个挑战。关键问题在于,无法提取有用的特征作为高质量表示,供推荐代理优化其策略。为了解决这个问题,我们提出了用于互动推荐的对比表示(CRIR)。CRIR能够高效地从显式交互中提取潜在的高级偏好排序特征,并利用这些特征来增强用户表示。具体来说,CRIR通过一个表示网络提供表示,并通过我们提出的偏好排序对比学习(PRCL)进行优化。PRCL的关键理念是,它可以在不依赖于涉及高级表示或庞大潜在动作集的计算的情况下进行对比学习。此外,我们还提出了一种数据利用机制和代理 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
金昌市场监管
·
多款药品说明书修订
8 小时前
药渡
·
好书推荐丨药明康德译丛《抗癌疗法——从药物发现到临床应用》
21 小时前
药安食美诚信河北
·
防治流感,国家卫健委点名了这6种药!
2 天前
上海高招发布
·
【高复】复读生再战高考,有什么限制吗?
6 月前
设计馆
·
桶装水or净水机,你家喝水方式,是哪种呢?
6 月前
令狐公子的人生记录仪
·
老后破产
4 月前