文章预览
在CIKM 2024大会上,小红书向量检索团队的论文《A Real-Time Adaptive Multi-Stream GPU System for Online Approximate Nearest Neighborhood Search》荣获应用研究赛道最佳论文奖。 论文提出了一种实时多流GPU在线近似最近邻检索系统(RTAMS-GANNS),通过动态向量插入算法和多流并发机制,解决了GPU向量检索在高QPS场景下的实时向量插入难题,相关技术已成功应用于搜索与推荐系统。 CIKM是信息和知识管理领域的顶级国际会议,由ACM和SIGIR主办,本届应用研究赛道吸引了来自工业界和学术界400余篇投稿,316篇论文进入评审程序,最终有103篇论文被录用,仅一篇论文获评最佳应用研究论文奖。 论文链接: https://dl.acm.org/doi/10.1145/3627673.3680054 1.1 背景和局限 近似最近邻搜索(Approximate Nearest Neighbor Search, ANNS)已在现代搜索、推荐系统及大模型增强生成(Retrieval-Augmented Generation, RAG)
………………………………