专栏名称: AIGC Studio
一个有趣有AI的AIGC公众号:关注AI、深度学习、计算机视觉、AIGC、Stable Diffusion、Sora等相关技术。这里不仅有简单易懂的AIGC理论实践和AI学习路线,还有大厂工作经历和体会分享。如果有幸能给你一些帮助就更好啦!
今天看啥  ›  专栏  ›  AIGC Studio

IBM提出多模式图像文本到文本模型SmolDocling,可实现代码 | 公示 | 图表 | 表格 | 标题 高效转换!

AIGC Studio  · 公众号  ·  · 2025-04-02 00:07
    

文章预览

Docling团队联合IBM提出了一种多模式图像文本到文本模型SmolDocling,旨在实现高效的文档转换。它保留了 Docling 最受欢迎的功能,同时通过无缝支持DoclingDocuments确保与 Docling 完全兼容。目前已经冲到了Huggingface 热门榜单 Top 3! 相关链接 主页:https://huggingface.co/ds4sd/SmolDocling-256M-preview 论文:https://arxiv.org/abs/2503.11576 试用:https://huggingface.co/spaces/ds4sd/SmolDocling-256M-Demo 特点: 🏷️用于高效标记化的 DocTags - 引入了 DocTags,一种与DoclingDocuments完全兼容的高效且最小化的文档表示。 🔍 OCR(光学字符识别)——从图像中准确提取文本。 📐布局和本地化——保留文档结构和文档元素边界框。 💻代码识别——检测并格式化代码块(包括标识)。 🔢公式识别——识别和处理数学表达式。 📊图表识别——提取并解释图表数据。 📑表格识别——支持列和行标题以 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览