专栏名称: CVHub
门头沟学院AI视觉实验室御用公众号 | 学术 | 科研 | 就业
目录
相关文章推荐
完美Excel  ·  在Word中控制PowerPint ·  4 天前  
今天看啥  ›  专栏  ›  CVHub

Make YOLO Great Again | 上海AI实验室推出DocLayout-YOLO: 速度精度绝佳的文档布局分析模型

CVHub  · 公众号  ·  · 2024-10-24 21:30
    

文章预览

论文地址 :https://arxiv.org/pdf/2410.12628 论文源码 :https://github.com/opendatalab/DocLayout-YOLO 项目主页 :https://huggingface.co/spaces/opendatalab/DocLayout-YOLO 导读 TL;DR : 本文提出了一个名为 DocLayout-YOLO 的新方法,旨在通过多样化的合成数据和全局到局部的自适应感知来增强 文档布局分析 。 在当今数字化的世界里,文档布局分析(DLA)是理解和处理文档的关键步骤。想象一下,你手中有一堆杂乱无章的文件,DocLayout-YOLO就像一个超级助手,能够快速帮你识别出文件中的文本、标题、表格等不同区域。这项技术对于提高文档处理的自动化和准确性至关重要。 在以往的文档解析领域,研究者们一直在 速度 和 准确性 之间寻找平衡。其中: 多模态方法通过结合视觉和文本信息虽然准确度高,但处理速度慢; 而单模态方法仅依赖视觉特征,虽然处理速度快,但准确性较 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览