今天看啥  ›  专栏  ›  PaperAgent

Anthropic分享RAG最佳实践:Contextual Retrieval!

PaperAgent  · 公众号  ·  · 2024-09-20 18:12

文章预览

先说结论, Anthropic提出 了一种显著改进RAG中检索步骤的方法。这种方法被称为“ 上下文检索(Contextual Retrieval) ”: 它使用两种子技术: 上下文嵌入 (Contextual Embeddings)和 上下文BM25 这种方法可以将 检索失败的次数减少49% 并且 当结合重排时,减少67% 。 上下文检索(Contextual Retrieval) 的出发点: RAG是一种从知识库检索相关信息并将其附加到用户提示上的方法,显著提升了模型的响应。但是 传统的RAG解决方案在 编码信息时会移除上下文 ,这常常导致系统无法从知识库中检索到相关信息。 关于仅使用更长提示的说明 有时最简单的解决方案就是最好的。如果你的知识库小于200,000个token( 大约500页材料 ),你可以将整个知识库包含在你给模型的提示中,无需RAG或类似方法。 几周前,Anthropic为Claude发布了 提示缓存 ,这使得这种方法显著更快且更 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览