文章预览
图一:一个「经典」的 RAG 系统数据流转 我们看这张图里面,一个「经典」(这里值得时距离当前三周以前的时间...)的 RAG 系统会假设你是一个正经的用户,会按照套路正经的使用系统 1、2、3、4、5、6 步走下来。 但大家都清楚,一旦你的代码放到生产环境中,啥用户都能碰到,就是碰不到几个「正经」用户,你无法让用户按照你设定的套路问问题,比如在一个讨论毕加索同志作品、生平、创作风格的上下文里面,很多用户上来问的问题却是,“你好,今年你几岁?“... “今年你几岁?” 这种问题当然适合直接扔给神奇的 ChatGPT 直接回答,但正如上图,一个「传统」的 RAG 其实要先把用户的输入通过 2、3 两步,放到自有的向量数据库里面走一遍,然后把拼接出来的结果通过 4 再扔给 GPT 们来寻求比较流畅的答案的。那么有没有办法可以
………………………………