专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

厦门大学首发多模态阅读理解新任务：图文深度融合数据集VEGA

PaperWeekly · 公众号 · 科研 · 2024-07-11 22:04

文章预览

介绍多模态大型语言模型（MLLMs）的高速发展彰显了其在处理图文信息方面的强大潜力。然而，目前的多模态模型和方法主要集中于处理基础视觉问答（VQA）任务，这些任务通常只涉及与问题强相关的有限图片和文本信息。在实际应用中，尤其是文档理解领域，模型经常需要处理更为复杂的图文混合输入，这些输入不仅长度更长，而且可能包含冗余甚至误导性的信息。现有的主流 MLLMs 在处理此类复杂任务时表现不佳，且缺乏相应的 Benchmark 来评估模型在这些任务上的性能。近日，来自厦门大学纪荣嵘团队提出了一个全新的多模态任务——交错图文阅读理解（Interleaved Image-Text Comprehension, IITC）。该任务要求模型处理包含复杂图文交错信息的输入，并在回答问题时明确指出其参考的图片。为了有效评估和提升模型在 IITC 任务上的表现，他们构建了 V ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

实验万事屋 · 导师问我博士生课题能不能发一篇48.8分的Cell，我心里想：你要是不想听假话，就尽量别问这种蠢问题……

2 天前

科研大匠 · 耿美玉团队最新论文，揭示国产阿尔茨海默病新药GV-971靶向肠道细菌的治疗机制

5 天前

研之成理 · 中国科学技术大学江海龙教授Angew：MOF中金属单原子位点周围特定位置的微环境调控促进催化性能提升

6 天前

实验万事屋 · 要相信，读了博士让我变得更好了，我原来只是无助，现在我觉得我好无助……

5 天前

弗雷赛斯 · SCI查重，你可能已经被坑了...

5 天前

勇汽水 · 🏅-20240804002125

3 月前

下厨房 · 当季必吃！生吃脆甜、熟吃软糯。清香四溢，煮出一碗“仙”气飘飘。

3 月前

三剑客 · 军恋，不送礼物真不行！

2 月前

厦门大学首发多模态阅读理解新任务： 图文深度融合数据集VEGA

文章预览

厦门大学首发多模态阅读理解新任务：图文深度融合数据集VEGA