文章预览
今天分享一篇PaperAgent-RAG专栏技术交流群小伙伴(@知乎 奔跑的日月 )关于微软最新开源的GraphRAG框架源码解读文章(已授权转载)。 文章有5千字,建议收藏观看,知乎原文: https: //zhuanlan.zhihu.com/p/707759736 1. 引言 这几天微软开源了一个新的基于知识图谱构建的检索增强生成(RAG)系统, GraphRAG, 该框架旨在利用大型语言模型(LLMs)从非结构化文本中提取结构化数据, 构建具有标签的知识图谱,以支持数据集问题生成、摘要问答等多种应用场景。GraphRAG 的一大特色是利用图机器学习算法针对数据集进行语义聚合和层次化分析,因而可以回答一些相对高层级的抽象或总结性问题, 这一点恰好是常规 RAG 系统的短板。说实话之前一直有在关注这个框架, 所以这两天花了点时间研究了一下源码, 结合之前的一些技术文档,本文主要是记录 GraphRAG 源码方面的一
………………………………