专栏名称: 斌叔OKmath
橙旭园CEO 教育博主 教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。
今天看啥  ›  专栏  ›  斌叔OKmath

不要做 RAG提出缓存增强生成(CAG)来消除检索延迟并最大限度-20250109135938

斌叔OKmath  · 微博  ·  · 2025-01-09 13:59
    

文章预览

2025-01-09 13:59 本条微博链接 不要做 RAG 提出缓存增强生成(CAG)来消除检索延迟并最大限度地减少检索错误。 CAG 是什么? CAG 旨在通过预先将所有相关文档预加载到 LLM 中并预先计算键值 (KV) 缓存来充分利用长上下文 LLM 的功能。 预加载的上下文有助于模型提供上下文准确的答案,而无需在运行时进行额外的检索。 何时申请CAG? 当需要检索的文档/知识规模有限且易于管理时,它是 RAG 的一个有用替代方案。 我的想法:随 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览