专栏名称: 关于NLP那些你不知道的事

整理自然语言处理、推荐系统、搜索引擎等AI领域的入门笔记，论文学习笔记和面试资料（关于NLP那些你不知道的事、关于推荐系统那些你不知道的事、NLP百面百搭、推荐系统百面百搭、搜索引擎百面百搭）

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

RAG 的优化方案及评估

关于NLP那些你不知道的事 · 公众号 · 科技自媒体 · 2024-09-02 00:00

主要观点总结

本文介绍了RAG（Retrieve Augmentation Generation）的优化方案及评估体系。作者通过查看相关资料和论文，结合个人应用体验，总结了针对RAG框架的优化方案。这些优化方案旨在提高RAG的性能和效果。

关键观点总结

关键观点1: RAG的优化方案

包括查询环节优化、检索环节优化、Rerank优化、模型微调等。其中查询环节优化旨在提高查询的准确性和鲁棒性；检索环节优化包括创建多层级索引、融合或混合搜索等；Rerank环节通过更精确的排序提高MMR和命中率；模型微调则针对特定领域提高模型效果。

关键观点2: RAG的评估体系

包括检索质量评价和生成质量评价。检索质量评价采用MMR（平均倒排率）、Hits Rate（命中率）、NDCG（归一化折损累积增益）等指标；生成质量评价则关注噪声的鲁棒性、信息融合能力、噪声的拒绝能力、反事实的稳健性等。

关键观点3: RAG Module的优化

介绍了一些常见的RAG模块，如Search module、Memory module、Fusion module和Routing module等，并指出它们的优化方法和作用。

关键观点4: 自适应检索与递归检索

介绍递归检索和自适应检索的概念和作用，指出它们能够增强搜索体验和提高信息来源的效率和相关性，但也需要消耗较大的资源成本。

文章预览

RAG 的优化方案及评估作者：soso 原文地址：https://zhuanlan.zhihu.com/p/681421145 笔者大概在2-3个月前开始进行 RAG 项目并学习RAG，通过查看相关资料和论文，并结合笔者的个人应用体验，总结了目前的一些针对RAG框架的优化方案。希望能帮助到和我一样的初学者。一、RAG Definition 由于通用的 LLM 预训练数据存在限制，缺乏实时知识或者垂直知识，而不断地 fine-tuning又存在较大的成本。因此一种解决该问题的方式出现了。首先通过 Retrieve 外部知识库的文档来为 LLM 提供补充信息的上下文，并与最初的问题一起被合并成一个 Augmentative 的提示，而后输入LLM 使 LLM 能够 Generate 更有效的回答。顾名思义这就是 RAG （Retrieve Augmentation Generation）二、General RAG Framework 通用的 RAG 框架如下：多文档切分成 chunks; 将 chunks 索引化并存储，目前基于LLM 对文本进行embeddi ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

东西文娱 · 迪士尼娱乐：很清楚中国电影市场在改变，但为什么依然乐观？

昨天

sven_shi · 确实是酒量不行，不会喝酒。 -20241126211434

2 天前

招商大宗商品研究 · 农产品 | 原木供应端产业研究报告（二）

3 天前

招商大宗商品研究 · 农产品 | 原木供应端产业研究报告（二）

3 天前

璀璨科学 · 月面着陆器首次公开！王亚平试穿登月航天服，中国载人登月倒计时？

5 天前

璀璨科学 · 月面着陆器首次公开！王亚平试穿登月航天服，中国载人登月倒计时？

5 天前

DT商业观察 · 始祖鸟母公司终于扭亏为盈；血糖仪被年轻人买爆；张一鸣又出新爆款了

5 天前

DT商业观察 · 始祖鸟母公司终于扭亏为盈；血糖仪被年轻人买爆；张一鸣又出新爆款了

5 天前

中科创星 · 多家中科创星投资企业上榜中国科协2023年“科创中国”系列榜单

4 月前

好奇博士 · 睡觉时有这 4 种异常，不用担心，睡眠质量没啥问题！

4 月前

不正常人类研究中心 · 再好的朋友时光流逝也会疏远吧

1 月前

文化人才在线 · 上海最新公示：跨越黄浦江将有新方式！慢行隧道还是缆车？官方回应→

1 月前