专栏名称: 无人之路
无人之路,自己领航。
今天看啥  ›  专栏  ›  无人之路

【学习LangChain】06. RAG进阶 - Splitter,Retriever & Generation

无人之路  · 公众号  ·  · 2024-09-01 17:13
    

文章预览

前接: 【学习LangChain】04.  RAG基础 【学习LangChain】05.  RAG进阶 - Embeddings & Loaders RAG进阶:Splitter CharacterTextSplitter 在深入loader之后,我们来看看splitter会怎样影响RAG的运行。在之前的示例中,我们使用的都是CharacterTextSplitter来切分文档: import  os  from  langchain.text_splitter  import  CharacterTextSplitter from  langchain_community.document_loaders  import  TextLoader from  langchain_openai  import  ChatOpenAI, OpenAIEmbeddings load_dotenv() # set the directory for vector store cur_dir = os.getcwd() file_name =  "Top 20+ RAG Interview Questions.txt" file_path = os.path.join(cur_dir,  "articles/RAG" , file_name) vdb_dir = os.path.join(cur_dir,  'db' ,  'chroma_db' ) os.makedirs(vdb_dir, exist_ok= True ) # load loader = TextLoader(file_path) docs = loader.load() text_splitter = CharacterTextSplitter(chunk_size= 500 , chunk_overlap= 0 ) chunks = text_splitter.split_d ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览