专栏名称: AI工程化
专注于AI领域(大模型、MLOPS/LLMOPS 、AI应用开发、AI infra)前沿产品技术信息和实践经验分享。
今天看啥  ›  专栏  ›  AI工程化

RAG 应用落地常见的三个挑战及解决思路

AI工程化  · 公众号  ·  · 2024-07-21 23:20

文章预览

简单用于原型展示的Rag应用并不复杂,但真要落地生产就会有很多现实的挑战,《AI工程化》 在 前面的文章里也介绍过很多领域内的一些解决思路和实践方案。这篇文章我们将介绍来自Florian June有关 RAG落地时面临的三个常见挑战以及解决思路。 不规范的查询和短查询 在生产环境中,用户Query非常多样,也不一定标准;许多Query语义不完整、表述不清晰或表达多种意图。另外,用户的Query越短,就越难处理。比如,像 "推荐酒店"、"告诉我足球新闻和今天的天气 "或 "苹果的好处 "这样的查询,RAG 系统会很难处理。 通常有三种方法可以处理: 1)意图分析:确定一个或多个用户意图,缩小召回范围。  如图所示,意图分析包括将用户的查询归类为一个或多个预定义的意图,从而缩小搜索范围。 意图分析主要有以下四种方法: a.基于预定义的规则或关键 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览