专栏名称: 老刘说NLP

老刘，NLP开源爱好者与践行者。主页：https://liuhuanyong.github.io。老刘说NLP，将定期发布语言资源、工程实践、技术总结等内容，欢迎关注。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

RAG前沿之CoV-RAG验证链增强及面向PDF文档的多模态RAG方案简析

老刘说NLP · 公众号 · · 2024-10-11 11:40

文章预览

今天是2024年10月11日，星期五，北京，天气晴。我们今天来看继续看RAG的两个工作，一个是一个面向PDF文档的RAG方案，可以理解为混合多模态检索，另一个是关于RAG与类COT的结合进展CoV-RAG。两个工作，都很工程化，算法成分不多，也很粗糙，但也看看。供大家参考并思考。一、一个面向PDF文档的多模态RAG方案看到一个工作，《PDF-WuKong: A Large Multimodal Model for Efficient Long PDF Reading with End-to-End Sparse Sampling》(https://arxiv.org/pdf/2410.05970，https://github.com/yh-hust/PDF-Wukong)，处理包含文本和图像的长PDF文档，如学术论文。其标题取得很宏大，实际上就是一个多模态RAG。 ‍ ‍ ‍ ‍ 可以看几个点：一个是当前处理长文档的代表模型。另一个是PDF-WuKong架构。 1、架构 PDF-WuKong的架构包括文档解析器、稀疏采样器和模型。文档解析器将PDF文档转换为交错的文本块 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

广西交通台 · 头皮发麻！4名女子胸口竟搜出8条活的……

2 天前

广西交通台 · 头皮发麻！4名女子胸口竟搜出8条活的……

2 天前

秦皇岛晚报 · 新年慰问传递社区温情

2 天前

秋叶PPT · 向佐只顾自己帅，却把郭碧婷P成外星人？？？

3 天前

湛江日报 · 演员王星获救！这四大骗局要警惕

4 天前

新则 · 大鱼聊天室·城市印象第一站，聊聊不同人眼中的上海律师 | 欢迎预约直播

4 天前

新则 · 大鱼聊天室·城市印象第一站，聊聊不同人眼中的上海律师 | 欢迎预约直播

4 天前

淘股吧 · 提升认知篇之识别核心拐点切入的三大技巧

6 月前

学术会议资讯 · 【征稿】东亚视阈中的俗文学研究学术研讨会暨中国俗文学学会2024年年会

6 月前

混沌天成研究 · 【农产品早评】马来提高出口关税，棕榈油创新高

2 月前

中国能源报 · 巡鹰新能源董事长褚兵：竞逐新能源汽车“最后一公里”

1 月前