专栏名称: 开源先锋
分享Github上最有趣的开源项目
今天看啥  ›  专栏  ›  开源先锋

12.5K star!快速精准实现PDF转Markdown,这个项目好强!

开源先锋  · 公众号  ·  · 2024-06-15 21:02

文章预览

* 戳上方蓝字“ 开源先锋 ”关注我 推荐阅读: 《183K star!全网最强自托管项目,程序员必备!》 大家好,我是开源君! 在我们日常的工作和学习中,PDF文件随处可见。然而,PDF文件的编辑和内容提取却不那么方便。很多时候,我们希望把PDF中的内容提取出来,转成Markdown格式,以便于编辑和发布。但这个过程通常很麻烦,需要手动复制粘贴,还要重新调整格式,简直是浪费时间和生命。 今天开源君介绍的这个项目就是为了解决这个问题- Marker ,可以让PDF转Markdown变得简单高效。 项目简介 marker 是一个基于深度学习模型的工具,能够快速且准确地将PDF文档转换成Markdown格式,不仅能保留PDF中的文本、图片和表格,还能尽量保持原有的排版结构。支持多种文档类型,尤其对书籍和科学论文进行了优化,并且支持多种语言。 Marker的转换流程: 文本提 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览