图像处理：文档矫正DocTr++

机器学习AI算法工程 · 公众号 · · 2024-06-05 11:00

文章预览

向AI转型的程序员都关注了这个号 👇👇👇 前言这段时间一直在搞文档矫正相关实验，阅读了大量相关论文，今天来记录一篇目前比较经典，实用性较好的方法，doctr++ paper：https://arxiv.org/abs/2304.08796 一、介绍 Doctr++除了提出一种新的architecture外，most importantly，提出了一种新的数据处理方式，解决了以前文档矫正只能处理带有边界信息的完整文档，文章通过数据处理定义了三种类型的训练数据。图1展示了三类常见的形变文档图像：(a) 包含完整文档边界，(b) 包含部分文档边界，(c ) 不包含文档边界。二、方法理论其实网络结构很简单，input未矫正图像，firstly，extract the feature through CNN， then，经过一个transformer（这个部分相比original transformer结构有变动），finally，经过一个flow head进行最终预测。具体结构如下：首先, 在畸变特征编码器中，DocTr++采 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博