今天看啥  ›  专栏  ›  LangChain

LangChain - RAG:线上系统多文档要频繁更新,每次都要重新花钱做一次 embedding,老板不批预算,批我...

LangChain  · 知乎专栏  ·  · 2023-09-10 10:27

文章预览

图一:embedding 类似于搜索引擎的索引,没有 update,只有 insert 或者 delete 互联网排名第一的文档格式是什么?当然是 html!那排名第二的呢? PDF! 做为大模型落地的两大方向之一,RAG 有个很大的坑等着我们,设想一下,需要定时更新一匹 PDF 文件到 RAG chatbot 里面去,总量不算多也不算少大约 15,000~ 的样子,开发环境里面根本没考虑过重新 re-index、re-embedding 的事,事到临头要更新了才想起来要重新做 embedding 不仅耗时更要耗钱,结果老板不出所料的不批预算,批我解气... 怎么破? LangChain 提出的方案如下图所示,暂且称它为「增量更新」模式,在 data-transform 这一步、embedding 之前针对每一个 document 做一次 hash,记录下来 hash 值,每次源数据更新了只需要在这一步里面比对一下,更新的 document 对应的 embedding 删掉,生成新的插入到原有 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览