专栏名称: 老刘说NLP

老刘，NLP开源爱好者与践行者。主页：https://liuhuanyong.github.io。老刘说NLP，将定期发布语言资源、工程实践、技术总结等内容，欢迎关注。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

基于LLM的开源情报工具建设及RAG之基于推理的检索计划生成思路：兼看昨日大模型进展回顾

老刘说NLP · 公众号 · 大数据科技自媒体 · 2024-07-30 11:46

主要观点总结

文章主要关注两个问题：一是回顾昨日大模型的进展，包括REAPER工作、大模型预训练进展、文档处理相关开源项目以及RAG和知识图谱方面的工作；二是关于REAPER基于推理的检索计划生成实现思路。REAPER作为一种基于推理的检索计划生成器，用于优化复杂RAG系统的性能，已在亚马逊的购物助理Rufus中得到验证。文章还介绍了REAPER的具体实现细节，包括模型选择、prompt提示的设计、微调数据增强等。

关键观点总结

关键观点1: 昨日大模型进展回顾

包括REAPER工作、大模型预训练进展、文档处理相关开源项目以及RAG和知识图谱方面的新发现。

关键观点2: REAPER工作介绍

REAPER是一种基于推理的检索计划生成器，用于优化复杂RAG系统的性能，已在亚马逊的购物助理Rufus中得到验证。

关键观点3: REAPER实现细节

包括模型选择、prompt提示的设计、微调数据增强等方面的具体实现。

关键观点4: 社区活动介绍

介绍了相关的线上交流预告和社区活动，包括社区第27讲和基于LLM的开源情报工具研究分享。

文章预览

今天是2024年7月30日，星期二，北京，暴雨。今天来看两个问题：一个是回顾下昨日大模型进展早报，会有一些新发现。二是来看看一个RAG的工作，REAPER，用于亚马逊的购物助理Rufus中得，可以看下其具体实现细节。一、昨日（2024-07-29）大模型相关进展早报我们首先来回顾下昨日大模型进展，这是社区每日例行活动，主要围绕大模型训练、文档处理、RAG、知识图谱等方向，感兴趣的可以加入共享。昨日进展主要包括： REAPER: Reasoning based Retrieval Planning for Complex RAG Systems，一种基于推理的检索计划生成器REAPER；关于大模型继续预训练，Towards Effective and Efficient Continual Pre-training of Large Language Models，Llama-3-SynE，一种通过持续预训练（CPT）改进Llama-3模型的方法； 7个pdf文档转markdown开源项目； RAG方面的ChatQA 2: Bridging the Gap to Proprietary LLMs in Long Context and RA ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

北京经信局 · 2025全球数字经济大会首设欧洲分会场！3月4日相约巴塞罗那！

4 小时前

北京经信局 · 2025全球数字经济大会首设欧洲分会场！3月4日相约巴塞罗那！

4 小时前

数据派THU · AAAI 2025 | 大模型会组合关系推理吗？打开黑盒，窥探Transformer脑回路

昨天

酷玩实验室 · 化学加钠，数学开挂...现在的教育软件都被玩得这么抽象了？

2 天前

江苏知识产权 · 江苏开展海外知识产权保护工作交流座谈

3 天前

信息平权 · 阿里超预期的关键点

3 天前

信息平权 · 阿里超预期的关键点

3 天前

生物岛 · Dev Cell | 广州医科大学张满/范小英等团队发现抑制HDAC活性直接将小鼠胚胎干细胞重编程为滋养细胞干细胞

8 月前

广西师乐 · 教育局自主公开招聘急需紧缺教师！全部事业编制！

3 月前

安徽交通广播 · “通知员工不结婚就解聘”？最新回应

1 周前