专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
今天看啥  ›  专栏  ›  老刘说NLP

大模型RAG问答最佳实践策略:从文档分块、向量化到查询检索再到生成微调、评估

老刘说NLP  · 公众号  ·  · 2024-07-07 11:40
    

文章预览

今天是2024年7月7日,星期日,北京,天气晴。 昨日,老刘在Datafuntalk 2024线下峰会(北京)作了  《RAG落地中的知识库建设、现实坑点及应用探索》  的技术分享,现场不少人感兴趣,挺火爆,主要还是围绕RAG知识库部分的一些工作进行论述,很有趣,也做了一些方法论上的指引。 在今晚八点,我们将在社区继续做一次这个报告,围绕这个话题,感兴趣的可以加入社区【方式见文末】,参与交流。 事实上,在  "RAG方案人手一份"  的大背景下,如果找到一个最佳的实验设置,其实十分重要,虽然说,RAG当前实际上是处于一个实验科学的状态,但也可以看看一些系统性的消融实验。 因此,今天,我们来看看关于RAG的一个实验报告,《 Searching for Best Practices in Retrieval-Augmented Generation 》,( https://arxiv.org/abs/2407.01219 ),正如其名字所言,该工作对RAG技术的最 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览