文章预览
RAG(检索增强生成)模型,通常被称为RAG系统,在大模型应用场景中被广泛使用。模型的原理其实很简单:根据用户的需求从数据集中检索信息,再使用大模型进行推理生成。 RAG的优势在于能够通过提供来自外部数据源来提高大模型的准确性和可靠性,这种方式可根据具体应用场景定制上下文信息,并且能够保持数据新鲜度,而无需进对大模型重新培训或者微调。 但 RAG 在实际应用中也存在不准确的情况。接下来我们进一步了解一下RAG的原理和优化方案。 RAG可以概括为三个步骤: (1)索引 索引是LLM获得准确上下文以及答案的基础。建立索引需要先提取和清理文件数据,如Word、PDF或HTML文件。将文件内容转换为标准化的纯文本。因为大模型都有上下文限制,因此需要把文本分成更小的块。这个过程被称为切片。之后,使用嵌入模型把每个文本块被
………………………………