Docmatix - 超大文档视觉问答数据集

Hugging Face · 公众号 · · 2024-08-29 23:00

文章预览

本文，我们将发布 Docmatix - 一个超大的文档视觉问答 (DocVQA) 数据集，比之前的数据集大 100 倍。当使用 Docmatix 微调 Florence-2 时，消融实验显示 DocVQA 任务的性能提高了 20%。 Docmatix - 一个超大的文档视觉问答 (DocVQA) 数据集 https://hf.co/datasets/HuggingFaceM4/Docmatix Docmatix 数据集样本示例缘起于丹鼎 (The Cauldron) 的开发，丹鼎包含了 50 个数据集，旨在用于视觉语言模型 (VLM) 的微调，我们的 Idefics2 就是由此训得。在丹鼎的开发过程中，我们发现缺乏大规模文档视觉问答 (DocVQA) 数据集。Idefics2 依赖的视觉问答数据集主要是 DocVQA，其中仅包含 1 万张图像以及 3 万 9 千对问答 (Q/A)。基于其以及其他数据集微调出的开源模型在性能上与闭源模型差距很大。丹鼎 (The Cauldron) https://hf.co/datasets/HuggingFaceM4/the_cauldron Idefics2 https://hf.co/blog/idefics2 为了解决这一问题，我们 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

搜猪 · 锁定明晚8点：搜猪网在线发布《中国生猪预警年报》

10 小时前

搜猪 · 生猪现货日报|全国均价15.91元/公斤节前最后一周供应压力不减各地猪价或震荡走低为主

昨天

搜猪 · 2025年春节各地屠宰厂及养殖公司停开工安排情况

昨天

搜猪 · 生猪现货日报|全国均价15.52元/公斤供需双增下未来一周猪价或保持横盘偏弱震荡

2 天前

搜猪 · 搜猪网中国生猪预警年报发布倒计时3天！

2 天前

YXC扬兴科技 · YXC有源新品丨1.2V超低功耗时钟解决方案

5 月前

跨通社 · TikTok Shop 全托管黑五启航大会：服饰商家开启“更新、更好、更丰富”差异化增长

4 月前

科Way · 上海网球大师赛 : 区领导会见外资巨头，共话浦东投资新机遇！

3 月前