文章预览
项目简介 我们提出DocLayout-YOLO的基于YOLO-v10,通过提供多样性文档预训练及适配文档检测的模型结构优化,可针对多样性文档进行实时鲁棒的检测。在文档预训练阶段,我们提出Mesh-candidate BestFit,将文档合成视为二维装箱问题,合成类型多样性的大规模合文档数据集DocSynth-300K。在模型结构优化方面,我们提出了全局到局部可控的感知模块,确保在尺度变化不一的文档元素上得到精准检测结果。 快速使用 在线演示目前已经上线。对于本地开发部署,参考以下步骤: 1. 环境配置 参考以下步骤配置环境: conda create -n doclayout_yolo python=3.10 conda activate doclayout_yolo pip install -e . 注意: 如果只想使用DocLayout-YOLO的推理功能,直接通过 pip 进行安装: pip install doclayout-yolo 2. 模型推理 可以通过脚本的方式或者SDK的方式进行推理: 脚本推理 通过以下命令运行推
………………………………