文章预览
简单用于原型展示的Rag应用并不复杂,但真要落地生产就会有很多现实的挑战,《AI工程化》 在 前面的文章里也介绍过很多领域内的一些解决思路和实践方案。这篇文章我们将介绍来自Florian June有关 RAG落地时面临的三个常见挑战以及解决思路。 不规范的查询和短查询 在生产环境中,用户Query非常多样,也不一定标准;许多Query语义不完整、表述不清晰或表达多种意图。另外,用户的Query越短,就越难处理。比如,像 "推荐酒店"、"告诉我足球新闻和今天的天气 "或 "苹果的好处 "这样的查询,RAG 系统会很难处理。 通常有三种方法可以处理: 1)意图分析:确定一个或多个用户意图,缩小召回范围。 如图所示,意图分析包括将用户的查询归类为一个或多个预定义的意图,从而缩小搜索范围。 意图分析主要有以下四种方法: a.基于预定义的规则或关键
………………………………