专栏名称: GitHubStore
分享有意思的开源项目
今天看啥  ›  专栏  ›  GitHubStore

文档布局分析工具DocLayout-YOLO

GitHubStore  · 公众号  ·  · 2024-10-24 08:44

文章预览

项目简介 我们提出DocLayout-YOLO的基于YOLO-v10,通过提供多样性文档预训练及适配文档检测的模型结构优化,可针对多样性文档进行实时鲁棒的检测。在文档预训练阶段,我们提出Mesh-candidate BestFit,将文档合成视为二维装箱问题,合成类型多样性的大规模合文档数据集DocSynth-300K。在模型结构优化方面,我们提出了全局到局部可控的感知模块,确保在尺度变化不一的文档元素上得到精准检测结果。   快速使用 在线演示目前已经上线。对于本地开发部署,参考以下步骤: 1. 环境配置 参考以下步骤配置环境: conda create -n doclayout_yolo python=3.10 conda activate doclayout_yolo pip install -e . 注意:  如果只想使用DocLayout-YOLO的推理功能,直接通过 pip 进行安装: pip install doclayout-yolo 2. 模型推理 可以通过脚本的方式或者SDK的方式进行推理: 脚本推理 通过以下命令运行推 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览