文章预览
Abstract 摘要 从金融应用中产生的非结构化文本数据中提取和解释复杂信息,例如收益电话会议记录,即使使用当前最佳实践进行检索增强生成(RAG)(称为利用向量数据库进行信息检索的VectorRAG技术),也对大型语言模型(LLMs)提出了重大挑战,原因包括领域特定术语和文档复杂格式等挑战。我们提出了一种基于组合的新方法,称为HybridRAG,它结合了基于知识图谱(KGs)的RAG技术(称为GraphRAG)和VectorRAG技术,以增强从金融文档中提取信息的问题回答(Q )系统,已证明能够生成准确且具有上下文相关性的回答。通过对一组以Q 格式呈现的金融收益电话会议记录文档进行实验,从而提供了一组自然的真实Q 对,我们显示HybridRAG从向量数据库和KG中检索上下文的能力,在检索准确性和答案生成方面,在检索和生成阶段的评估中,优于传统的VectorRAG和Grap
………………………………