专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

使用重排序(Re-Ranking)来改善LLM RAG检索

AINLP  · 公众号  ·  · 2024-08-29 23:17

文章预览

基于大型语言模型(LLM)的聊天机器人可以通过检索增强生成(RAG)技术来获取外部知识来增强大语言模型的能力。 这些外部知识可以减少错误答案(幻觉)并且还可以让模型获取到训练数据中没有包含的信息。 在RAG中,我们向LLM提供信息,比如PDF文档或维基百科文章,作为我们提示的额外上下文。 基本的RAG流水线: 使用编码器模型和向量数据库高效搜索相关的文档块。 然而,RAG聊天机器人遵循数据科学的老原则: 垃圾进,垃圾出 。如果文档检索失败,LLM模型就没有机会提供好的答案。 改进基础RAG流水线的方法是使用 重排序器(re-ranking) 。 重排序器将用户的问题和所有最初检索到的文档作为输入,并基于这些文档与问题的匹配程度重新排序这些文档。 下图显示了使用双编码器模型进行初始候选检索和交叉编码器模型进行重排序的高级两步 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览