专栏名称: OSC开源社区
OSChina 开源中国 官方微信账号
今天看啥  ›  专栏  ›  OSC开源社区

搞大模型,没有重排工具怎么行?

OSC开源社区  · 公众号  · 程序员  · 2024-07-12 21:54

文章预览

在说重排工具之前,我们要先了解一下 RAG。 检索增强生成(RAG)是一种新兴的 AI 技术栈,通过为大型语言模型(LLM)提供额外的 “最新知识” 来增强其能力。 基本的 RAG 应用包括四个关键技术组成部分: Embedding 模型:用于将外部文档和用户查询转换成 Embedding 向量 向量数据库:用于存储 Embedding 向量和执行向量相似性检索(检索出最相关的 Top-K 个信息) 提示词工程(Prompt engineering):用于将用户的问题和检索到的上下文组合成大模型的输入 大语言模型(LLM):用于生成回答 上述的基础 RAG 架构可以有效解决 LLM 产生 “幻觉”、生成内容不可靠的问题。 但是,一些企业用户对上下文相关性和问答准确度提出了更高要求,需要更为复杂的架构。一个行之有效且较为流行的做法就是在 RAG 应用中集成 Reranker。 什么是 Reranker? Reranker (重排器)是 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览