专栏名称: AI算法与图像处理
考研逆袭985,非科班跨行AI,目前从事计算机视觉的工业和商业相关应用的工作。分享最新最前沿的科技,共同分享宝贵的资源资料,这里有机器学习,计算机视觉,Python等技术实战分享,也有考研,转行IT经验交流心得
目录
相关文章推荐
心禅道  ·  投资#756 ... ·  昨天  
心禅道  ·  投资#756 ... ·  昨天  
木紫午盘  ·  12月24日 反包大涨 ·  2 天前  
木紫午盘  ·  12月24日 反包大涨 ·  2 天前  
今天看啥  ›  专栏  ›  AI算法与图像处理

DocLayout-YOLO |上海AI Lab最新兼具速度精度的文档布局分析模型

AI算法与图像处理  · 公众号  ·  · 2024-10-27 20:49
    

文章预览

上海AI Lab 提出基于YOLO-v10的 DocLayout-YOLO,代码已开源! 1、 DocLayout-YOLO DocLayout-YOLO是 一个 文档布局分析工具 ,通过多样化的合成数 据和全局到局部的自适应感知增强文档布局分析,提升处理速度和准确性 。 具体来说, 文档布局分析要实现的效果是,定位文档元素并识别所属的类别。 如下所示:可以使用文档分析工具,来实现确定试卷中的标题/图标/纯文本等等 真实世界的文档理解系统,文档布局分析是非常重要的,但在 速度和准确性 的权衡是一个挑战: 1、利用文本和视觉特征的多模式方法可以实现更高的准确性,但处理速度慢 2、仅依赖视觉特征的单模态方法,则会牺牲准确性为代价,但提供了更快的处理速度 DocLayout YOLO在速度和准确性方面都表现出色, 主要贡献 : 1、引入了Mesh候选BestFit算法,该算法将文档合成构建为二维装箱问题,生 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览