专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
今天看啥  ›  专栏  ›  老刘说NLP

文档表格结构识别技术与数据总结:兼看多模态表格理解基准设计及数据构建思路

老刘说NLP  · 公众号  ·  · 2024-06-16 11:50
    

文章预览

今天是2024年6月16日,星期日,北京,天气晴。 昨天,各位老刘说NLP社区顺利完成第二十一讲,围绕六月份半月度技术及文档处理方向的产研思路。 我们今天继续来看看文档智能领域的表格结构识别问题,通过一个工作整理进行论述。 另一个是多模态表格理解MMTab的设计以及数据构造方式【数据增强】,还推出了一个表格理解模型,其思路也很有趣,可以看看。 供大家一起参考并思考。 问题1:文档智能领域中的表格结构识别问题 在完成版式分析之后,如果识别文档元素是表格,那么则需要对表格进行处理。而表格结构识别又是其中的一个重点 。 一般而言,表格处理分成三个部分: TD任务, T able  D etection,表格识别 TSR任务, T able  S tructure  R ecognition,表格结构识别 TCD任务, T able  C ontent  R ecognition,表格内容识别 因此,我们有必要熟悉下表 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览