专栏名称: PaperAgent
日更,解读AI前沿技术热点Paper
今天看啥  ›  专栏  ›  PaperAgent

微软技术社区:做RAG?向量搜索还不够

PaperAgent  · 公众号  ·  · 2024-06-09 20:27
    

文章预览

RAG流程检索器肯定应该支持向量搜索,因为这可以找到与用户查询具有相似语义的文档,但向量搜索还不够。检索器应该支持完全混合搜索,这意味着它可以同时执行向量搜索和全文搜索,然后合并并重新排列结果。这将使RAG流程能够找到语义相似的概念,还可以找到精确匹配项,例如专有名称、ID和数字。   混合搜索步骤 Azure AI Search提供包含以下所有组件的完整混合搜索: 它使用距离度量(通常是余弦或点积)执行 向量搜索。 它使用BM25 评分算法执行 全文搜索 。 它使用倒数秩融合算法 合并 结果。 它使用语义排名器(Bing 使用的机器学习模型)对结果 重新排名 ,将每个结果与原始用户查询进行比较并分配 0-4 之间的分数。 什么时候需要混合搜索? 为了证明超越向量搜索的重要性,基于 来 自一家虚构的公司 文档,讨论了医疗保健和福利等 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览