专栏名称: 老刘说NLP

老刘，NLP开源爱好者与践行者。主页：https://liuhuanyong.github.io。老刘说NLP，将定期发布语言资源、工程实践、技术总结等内容，欢迎关注。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

相关文章推荐

半岛都市报 · 演员刘烨暴瘦17斤，引生病猜测！本人回应：气 ... · 昨天

南方新闻网 · 被曝出轨、PUA女性？知名歌手深夜发文回应！ · 2 天前

西湖之声 · “朱雀玄武敕令”申请改名！ · 2 天前

荆门晚报 · 41岁男星韩庚，发文告别 · 2 天前

命里有票 · 她（王菲）来听谢霆锋的演唱会了 · 2 天前

今天看啥 › 专栏 › 老刘说NLP

文档多模态RAG应该如何做？解析式orDocVQA式两类实现思路漫谈

老刘说NLP · 公众号 · · 2024-11-14 15:24

文章预览

今天是2024年11月14日，星期四，北京，天气晴。今天，我们来看看文档多模态RAG的工作，这个在之前的文章中也说过很多。 ‍ ‍ ‍ ‍ 通常，我们在调研一个工作时，最快的方式就是找一遍综述，如对于多模态RAG而言，对应的综述有：《Retrieving multimodal information for augmented generation: A survey》（https://arxiv.org/abs/2303.10868）；《RetrievalAugmented Generation for AI-Generated Content: A Survey》（https://arxiv.org/abs/2402.19473);《Retrieval-augmented generation for large language models: A survey》（https://arxiv.org/abs/2312.10997）而针对文档这个场景，如果检索的对象，都是位于文档内部本身，那么就变成文档自身的多模态RAG。仔细看了很多思路，老刘将文档多模态RAG分为两种路线，一种是解析式文档多模态RAG (将一个文档切分为页面，然后再用版式识别的方式对文档进行各种模态元素进行分 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

半岛都市报 · 演员刘烨暴瘦17斤，引生病猜测！本人回应：气得浑身发抖

昨天

南方新闻网 · 被曝出轨、PUA女性？知名歌手深夜发文回应！

2 天前

南方新闻网 · 被曝出轨、PUA女性？知名歌手深夜发文回应！

2 天前

西湖之声 · “朱雀玄武敕令”申请改名！

2 天前

西湖之声 · “朱雀玄武敕令”申请改名！

2 天前

荆门晚报 · 41岁男星韩庚，发文告别

2 天前

荆门晚报 · 41岁男星韩庚，发文告别

2 天前

命里有票 · 她（王菲）来听谢霆锋的演唱会了

2 天前

命里有票 · 她（王菲）来听谢霆锋的演唱会了

2 天前

三剑客 · 爱在深秋！最特别的礼物！

6 月前

一房一万 · 青浦“三冠王”国庆火爆全城！400万级必看地铁盘「保利建发·印象青城」抢购中！

6 月前

918云南交通台 · 快了！云南这条高速公路即将通车运营

3 月前

湖北商务 · 多举措释放都市圈红利

2 月前

JC万事通 · 清明假期“不打烊”！晋城重要公告！

3 周前