文章预览
通过检索增强生成(RAG)技术,从而让大模型调用外部知识源(比如个人和公司保存的大量文档)回答问题。 但是当回答针对整个文本语料库的全局性问题,如“数据集中的主要主题是什么?”,RAG却无能为力。 因为这类问题本质上是查询聚焦摘要(QFS)任务,而非一个明确的检索任务。 怎么办呢? 微软提出的知识图谱RAG(以下使用:Graph RAG)技术, 能够将复杂的、大规模文本数据集转化为易于理解和操作的知识结构,以便更好地理解实体(如人物、地点、机构等)之间的相互关系。 你可以把该技术理解为通过两个步骤简化文本索引: 首先,利用大型语言模型从文档中提取关键信息,构建出反映实体间关系的知识图谱; 然后,为这些实体的集合生成精炼的摘要。当用户提问时,系统会根据这些摘要生成初步答案,并将它们综合起来,提供一
………………………………