一个从大三就接触NLP的小小NLPer,本公众号每天记录自己的一点一滴,每篇文章最后也有托福单词等新知识,学技术同时,也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇!
目录
相关文章推荐
今天看啥  ›  专栏  ›  深度学习自然语言处理

复旦+上海AI Lab提出统一主动检索RAG,减少延迟,提升响应

深度学习自然语言处理  · 公众号  ·  · 2024-06-26 15:18

文章预览

这篇文章的标题是《Unified Active Retrieval for Retrieval Augmented Generation》,作者是Qinyuan Cheng等人,来自复旦大学和上海人工智能实验室。文章主要研究了在检索增强型生成(Retrieval-Augmented Generation, RAG)中,如何智能地决定何时使用检索来增强大型语言模型(LLMs)的输出。 文章指出,在RAG中,并非所有情况下检索都是有益的,对每个指令都应用检索是次优的。因此,确定是否进行检索对于RAG来说至关重要,这通常被称为主动检索(Active Retrieval)。现有的主动检索方法面临两个挑战: 它们通常依赖单一标准,难以处理各种类型的指令; 它们依赖于专业化和高度差异化的程序,这使得将它们结合到RAG系统中更加复杂,并导致响应延迟增加。 为了解决这些挑战,文章提出了一种名为统一主动检索(Unified Active Retrieval, UAR)的新框架。UAR包含四个正交标准, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览
推荐文章