专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
今天看啥  ›  专栏  ›  老刘说NLP

基于LLM的开源情报工具建设及RAG之基于推理的检索计划生成思路:兼看昨日大模型进展回顾

老刘说NLP  · 公众号  · 大数据 科技自媒体  · 2024-07-30 11:46

主要观点总结

文章主要关注两个问题:一是回顾昨日大模型的进展,包括REAPER工作、大模型预训练进展、文档处理相关开源项目以及RAG和知识图谱方面的工作;二是关于REAPER基于推理的检索计划生成实现思路。REAPER作为一种基于推理的检索计划生成器,用于优化复杂RAG系统的性能,已在亚马逊的购物助理Rufus中得到验证。文章还介绍了REAPER的具体实现细节,包括模型选择、prompt提示的设计、微调数据增强等。

关键观点总结

关键观点1: 昨日大模型进展回顾

包括REAPER工作、大模型预训练进展、文档处理相关开源项目以及RAG和知识图谱方面的新发现。

关键观点2: REAPER工作介绍

REAPER是一种基于推理的检索计划生成器,用于优化复杂RAG系统的性能,已在亚马逊的购物助理Rufus中得到验证。

关键观点3: REAPER实现细节

包括模型选择、prompt提示的设计、微调数据增强等方面的具体实现。

关键观点4: 社区活动介绍

介绍了相关的线上交流预告和社区活动,包括社区第27讲和基于LLM的开源情报工具研究分享。


文章预览

今天是2024年7月30日,星期二,北京,暴雨。 今天来看两个问题: 一个是回顾下昨日大模型进展早报,会有一些新发现。 二是来看看一个RAG的工作,REAPER,用于亚马逊的购物助理Rufus中得,可以看下其具体实现细节。 一、昨日(2024-07-29)大模型相关进展早报 我们首先来回顾下昨日大模型进展,这是社区每日例行活动,主要围绕大模型训练、文档处理、RAG、知识图谱等方向,感兴趣的可以加入共享。 昨日进展主要包括: REAPER: Reasoning based Retrieval Planning for Complex RAG Systems,一种基于推理的检索计划生成器REAPER; 关于大模型继续预训练,Towards Effective and Efficient Continual Pre-training of Large Language Models,Llama-3-SynE,一种通过持续预训练(CPT)改进Llama-3模型的方法; 7个pdf文档转markdown开源项目; RAG方面的ChatQA 2: Bridging the Gap to Proprietary LLMs in Long Context and RA ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览