专栏名称: 全栈修仙之路
专注分享 TS、Vue3、前端架构和源码解析等技术干货。
今天看啥  ›  专栏  ›  全栈修仙之路

PDF 转 Markdown 神器,精准且快速:支持 90 多种语言 OCR,还支持提取表格、图片和公式!

全栈修仙之路  · 公众号  ·  · 2024-06-02 10:28
    

文章预览

Marker [1]  是一个能快速、准确地将 PDF 转换为 Markdown 文档的工具,目前 Github 上的 Star 数是  9.4K 。 近期热文 当 AI 遇上爬虫:让数据提取变得前所未有的简单! 超强 OCR 新秀:支持 90 多种语言,性能超越云服务! 7.8K Star RAG 引擎:基于深度文档理解,最大程度降低幻觉、无限上下文快速完成 “大海捞针” 测试! Marker 主要特点 支持多种文档(针对书籍和科学论文进行了优化) 支持 90 几种语言 移除页眉/页脚/其他人工痕迹 格式化表格和代码块 支持提取和保存图片 将大多数方程转换为 latex 可在 GPU、CPU 或 MPS 上运行 Marker 性能 上图有关 marker 和 nougat 的测试,在 A6000 都需要大于 4GB 的 VRAM。 Marker 工作原理 Marker 是一个深度学习模型管道(pipeline): 提取文本,必要时进行 OCR,支持 heuristics、surya [2] 、tesseract 等 OCR 引擎 检测页面布局并查找阅读顺 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览