文章预览
这篇文章的标题是《Unified Active Retrieval for Retrieval Augmented Generation》,作者是Qinyuan Cheng等人,来自复旦大学和上海人工智能实验室。文章主要研究了在检索增强型生成(Retrieval-Augmented Generation, RAG)中,如何智能地决定何时使用检索来增强大型语言模型(LLMs)的输出。 文章指出,在RAG中,并非所有情况下检索都是有益的,对每个指令都应用检索是次优的。因此,确定是否进行检索对于RAG来说至关重要,这通常被称为主动检索(Active Retrieval)。现有的主动检索方法面临两个挑战: 它们通常依赖单一标准,难以处理各种类型的指令; 它们依赖于专业化和高度差异化的程序,这使得将它们结合到RAG系统中更加复杂,并导致响应延迟增加。 为了解决这些挑战,文章提出了一种名为统一主动检索(Unified Active Retrieval, UAR)的新框架。UAR包含四个正交标准,
………………………………