专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

【[29星]TokenOCR:一款面向文档理解的文本图像基础模型-20250307215027

爱可可-爱生活  · 微博  · AI  · 2025-03-07 21:50
    

文章预览

2025-03-07 21:50 本条微博链接 【[29星]TokenOCR:一款面向文档理解的文本图像基础模型,让机器更好地“读懂”图文内容。亮点:1. 首个token级别的图像文本数据集TokenIT,包含2000万图像和18亿token-mask对;2. 提出首个token级别的文本图像基础模型,支持多种下游任务;3. 基于TokenOCR构建的TokenVL模型,在文档视觉问答任务中表现卓越】 'A Token-level Text Image Foundation Model for Document Understanding' GitHub: github.com/Token-family/TokenOCR #文档 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览