文章预览
【点击】 加入大模型技术交流群 原文: https://zhuanlan.zhihu.com/p/704828374 所谓 RAG,简单来说,包含三件事情。 第一,Indexing。即怎么更好地把知识存起来。 第二,Retrieval。即怎么在大量的知识中,找到一小部分有用的,给到模型参考。 第三,Generation。即怎么结合用户的提问和检索到的知识,让模型生成有用的答案。这三个步骤虽然看似简单,但在 RAG 应用从构建到落地实施的整个过程中,涉及较多复杂的工作内容(细节上是魔鬼)。 架构几乎按照这个模块设计,但是各家落地方案各有不同 先看一下各家的技术方案 有道的QAnything 亮点在:rerank RAGFLow 亮点在:数据处理+index 智谱AI 亮点在文档解析、切片、query改写及recall模型的微调 FastGPT 优点:灵活性更高 下面分别按照模块比较各框架的区别 功能模块 QAnything RAGFLow 智谱AI FastGPT 知识处理模块 pdf文件
………………………………