文章预览
检索增强生成(Retrieval Augmented Generation,RAG)已经成为一项大语言模型应用领域的标准技术,通过整合与上下文相关、时效性强、或领域知识,并且在不需要改变模型权重的前提下生成用户想要的正确答案。 RAG在领域知识、即时数据等知识密集型任务特别有效,已成为减少模型幻觉的有效解决方案。 但在实际运用中,RAG存在如下几个问题: • 首先, 知识库文档可能包含大量噪声 ,无论是知识库内容的噪音,还是由于文档之间缺乏标准化(来自各种文档布局或格式,如.pdf、.ppt、.docx 等)。 • 其次,通常很少或根本没有人工标注的信息或相关性标签来支持文档分块、嵌入和检索过程, 使得整个检索问题在很大程度上属于无监督方法 ,且难以针对特定用户进行个性化处理。 • 第三, 对长文档进行分块无法保留整个文档的语义上下文 ,而且块越
………………………………