文章预览
Auto-Retrieval 是一种高级的RAG技术,它在启动向量数据库检索之前使用Agent LLM 动态 推断元数据过滤器参数 和 语义查询 ,而不是将用户查询直接发送到向量数据库检索接口(例如密集向量搜索)的朴素RAG。您可以将其视为查询扩展/重写的一种形式,也可以将其视为函数调用的一种特定形式;后文我们将给出实现逻辑和代码。达到效果如下: 用户输入 Give me a summary of the SWE-bench paper 推理结果 改写查询: summary of the SWE-bench paper 过滤参数: {"filters": [{"key": "file_name", "value": "swebench.pdf", "operator": "=="}], "condition": "and"} 实现步骤 我们借助 LlamaCloud来实现,主要通过 在LlamaCloud检索器上设置一个 Auto-Retrieval 功能。在高层次上,我们的自动检索函数使用一个调用函数的LLM来推断用户查询的元数据过滤器——比仅仅使用原始语义查询产生更精确和相关的检索结
………………………………