文章预览
导读 本次分享题目为《RAG2.0 引擎设计挑战和实现》。 主要包括以下几部分内容: 1. RAG1.0 的痛点和解决方向 2. 如何有效 Chunking 3. 如何准确召回 4. 高级 RAG 和预处理 5. RAG 未来如何发展 6. Q 分享嘉宾| 张颖峰 英飞流(上海)信息科技有限公司 创始人 编辑整理| 陈沃晨 内容校对|李瑶 出品社区| DataFun 01 RAG1.0 的痛点和解决方向 1. RAG 架构模式 对于上图所示的 RAG 架构模式,大家应该都比较熟悉。RAG 的标准流程包括四个阶段,即抽取(Extraction)、索引(Indexing)、检索(Retrieval)和生成(Generation)。 2. RAG 面临的挑战 RAG 通常会遇到如下一些挑战: 第一个挑战是向量的召回无法满足要求,即命中率很低。当前如果用一个纯向量数据库来做 RAG,其效果往往不够理想。 第二个挑战是文档结构复杂,数据太乱,“Garbage In,Garbage Out”
………………………………