文章预览
关注我们,深度学习AI应用 基于大模型的RAG应用,一个普遍的认识是: 做原型很简单,投入生产很难 为什么我的RAG应用很难按预期工作? 在之前的文章中我们曾经陆续的对RAG应用优化做过零星与局部的探讨,如融合检索、查询转换、多模态处理、Agentic RAG等。接下来我们将结合之前的方法与实践,总结形成更完整的企业级RAG应用的优化建议以供参考。 本篇将首先专注在RAG应用的索引阶段: 让数据更容易被拆分成可理解的知识块 处理简称、缩写、专有名词 对多模态文档的特别处理 优化文本块(chunk)的分割策略 对知识的语义进行丰富 设置并利用元数据 尝试不同的索引类型 测试并选择合适的嵌入模型 01 让数据更容易被拆分成可理解的知识块 在经典的RAG应用中,最后的LLM能看到的参考上下文只能是原始数据的一部分,即检索出来、与输入问
………………………………