文章预览
本文分享个人在RAG+LLM的知识问答上的雕花工作和思考。包括:问题改写、压缩上下文、低资源成本下的高吞吐、检索带图和Graph RAG。本文分享个人在RAG+LLM的知识问答上的雕花工作和思考。包括:问题改写、压缩上下文、低资源成本下的高吞吐、检索带图和Graph RAG。不足之处,还望批评指正。 一、问题改写 由于短文本query的语义信息少、query有时跟文本的语义匹配不对齐,导致检索召回较少或不匹配,为此可以考虑问题改写。通过改写,一定程度可以增加召回率。之前历史文章 《RAG+LLM:关于知识问答的思考》 中RAG-Fusin便是这个思路。 图1:问题改写 目前,有不少办法,如[1]所述。其中,从易用性和操作性来看,可以关注以下2种方法: (1)LangChain的MultiQueryRetriever: 直接抄multiQueryRetriever生成一系列改写的问题的提示词模板来用就行。[2] QUERY_PROMPT
………………………………