文章预览
来自公众号: 菜鸟教程 最近,我手上有个 PDF 资料需要转换为 Word 格式,这种转换功能在众多文档处理工具中已经相当普遍。 然而,出于好奇,我决定探索一下某宝平台,看看是否有人针对这一常见需求提供专门的商品服务。 搜索了一下关键词 “pdf转word” ,瞬间惊呆了,这种小功能竟然需求量这么大,都是几万人付款: 看完后,我想着这个用代码来实现是很简单的。 然后就找了一个 python 开源库 pdf2docx 来试试。 官方地址: https://pdf2docx.readthedocs.io/en/latest/ 开源地址: https://github.com/ArtifexSoftware/pdf2docx 项目介绍: Python 开源库 pdf2docx 是一个功能强大的工具,它专门用于将 PDF 文件转换为 DOCX 格式的文档, pdf2docx 利用了 PyMuPDF 和 python-docx 两个库,通过规则解析 PDF 文件的布局,并生成 Microsoft Word 兼容的 DOCX 文件。 安装 pip install pdf2docx
………………………………