今天看啥  ›  专栏  ›  全栈修仙之路

超强 OCR 新秀:支持 90 多种语言,性能超越云服务!

全栈修仙之路  · 公众号  ·  · 2024-05-28 07:14
    

文章预览

Surya [1]  是一款文档 OCR 工具包,支持以下功能: 支持  90  多种语言的 OCR,其基准测试优于云服务 任何语言的行级文本检测 排版分析(表格、图像、页眉等检测) 阅读顺序检测 近期热文 当 AI 遇上爬虫:让数据提取变得前所未有的简单! 2024 年最完整的 AI Agents 清单来了,涉及 13 个领域,上百个 Agents! 7.8K Star RAG 引擎:基于深度文档理解,最大程度降低幻觉、无限上下文快速完成 “大海捞针” 测试! Surya 使用场景 1.文本检测(Detection) 2.文字识别(OCR) 3.排版分析 4.阅读顺序检测 5.更多示例 Surya Benchmarks 文字识别 1.Surya vs Tesseract Model Time per page (s) Avg similarity ‍ ‍ ‍ ‍ surya .62 0.97 tesseract .45 0.88 2.Surya vs Google Cloud Vision 文本检测 Surya vs Tesseract 排版分析 Layout Type Precision Recall Image 0.95 0.99 Table 0.95 0.96 Text 0.89 0.95 Title 0.92 0.89 Surya 快速上手 1.安装 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览