专栏名称: 深度学习与NLP
专注深度学习、NLP相关技术、资讯,追求纯粹的技术,享受学习、分享的快乐。
目录
相关文章推荐
Quora文选英语  ·  老外说seeing ... ·  8 小时前  
今天看啥  ›  专栏  ›  深度学习与NLP

长文 | RAG的实战指南及探索之路

深度学习与NLP  · 公众号  ·  · 2024-12-04 11:00
    

主要观点总结

本文总结了关于RAG(检索增强生成)系统的主要技术点,包括query理解、检索模型、生成模型、插件、引用或归因生成以及评估等方面的内容。

关键观点总结

关键观点1: Query理解

介绍RAG系统中对查询理解的重要性,包括识别复杂查询、query改写、query扩写等技术。

关键观点2: 检索模型

详述检索模型在RAG系统中的作用,包括文本嵌入模型、向量数据库、索引结构等。

关键观点3: 生成模型

介绍生成模型在RAG系统中的应用,包括回复生成策略和prompt拼接策略等。

关键观点4: 插件(Demonstration Retriever for In-Context Learning)

阐述基于演示检索的上下文学习的概念,包括混合演示检索和重排模块等技术。

关键观点5: 引用或归因生成

探讨引用或归因在RAG系统中的作用和如何实现归因,包括模型生成和动态计算等方法。

关键观点6: 评估

介绍如何评估RAG系统的性能,包括Faithfulness、Answer Relevance和Context Relevance等评测指标和RGB、RAGAS等评测方法。


文章预览

今天给大家带来一篇知乎@孙鹏飞 的关于RAG实战的文章。 作者:孙鹏飞  知乎:https://zhuanlan.zhihu.com/p/682253496 1. 背景介绍 RAG(Retrieval Augmented Generation,检索增强生成 )方法是指结合了基于检索的模型和生成模型的能力,以提高生成文本的质量和相关性。该方法是Meta在2020年发表的文章《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》中提出的,该方法让LM(Language Model,语言模型)能够获取内化知识之外的信息,并允许LM在专业知识库的基础上,以更准确的方式回答问题。而在大模型时代,它更是用于解决幻觉问题、知识时效问题、超长文本问题等各种大模型本身制约或不足的必要技术。 2. RAG的挑战 RAG主要面临三个方面的挑战:检索质量、增强过程和生成质量。 2.1 检索质量 语义歧义: 向量表示(例如词嵌入)可能无法捕捉概念之间的细微差 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览