今天看啥  ›  专栏  ›  DataFunTalk

京东零售基于大模型的生成式检索技术实践

DataFunTalk  · 公众号  ·  · 2024-09-08 13:00
    

文章预览

在当今快速发展的信息检索领域,搜寻与推荐系统的召回机制扮演着至关重要的角色。 当前行业内主要依赖 KNN 算法来实现召回任务,但这一传统模型面临着诸多挑战。由于缺乏有效的交互机制,KNN 模型对于处理中长尾查询效果不佳;同时,它在索引构建和更新时损失巨大,也导致了存储和更新成本高昂。 为了克服这些挑战,生成式检索模型应运而生,它优化了召回范式,通过端到端的隐式交互方法,提高了检索的准确性。然而,生成式检索也有其固有缺点,如生成过程的计算成本较高,幻觉率高、以及可能产生与查询不相关的结果。 在此背景下,京东零售团队探索了 Lexical 方法,通过重新定义任务、采用 SFT、对齐(DPO)和约束生成,来提升结果的相关性和性能。 接着团队又引入了 SemanticID,用来加速推理过程并减轻索引负担。SemanticID 的生成 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览