文章预览
标题: TWIN V2: Scaling Ultra-Long User Behavior Sequence Modeling for Enhanced CTR Prediction at Kuaishou 地址:https://arxiv.org/pdf/2407.16357 学校,公司:人大,快手 会议:CIKM 2024 1. 导读 本文主要针对长期兴趣挖掘提出相关的解决方法。以往的方法(SIM和TWIN)通常采用两阶段方法来模拟长期用户行为序列,以提高效率。第一阶段使用基于搜索的机制,即通用搜索单元(GSU),从长序列中快速检索与目标item相关的序列子集。第二阶段使用精确搜索单元(ESU)计算检索结果的兴趣得分。用户行为序列在整个生命周期中的长度很长,可能达到 个,本文设计了TWIN-V2(TWIN的增强版本), 通过聚类来压缩生命周期行为,并发现更准确和多样化的用户兴趣 。 在离线阶段,分层聚类方法将生命周期行为中具有相似特征的item分组到一个聚类中。通过限制聚类的大小,可以将行为序列压
………………………………