专栏名称: AIGC Studio
一个有趣有AI的AIGC公众号:关注AI、深度学习、计算机视觉、AIGC、Stable Diffusion、Sora等相关技术。这里不仅有简单易懂的AIGC理论实践和AI学习路线,还有大厂工作经历和体会分享。如果有幸能给你一些帮助就更好啦!
今天看啥  ›  专栏  ›  AIGC Studio

gptpdf:使用大模型一键将PDF解析为markdown格式,文中附教程!

AIGC Studio  · 公众号  ·  · 2024-07-11 07:00
    

文章预览

今天给大家分享一个开源的项目, 使用视觉大语言模型(如 GPT-4o)将 PDF 解析为 markdown。 方法非常简单(只有293行代码),但几乎可以完美地解析排版、数学公式、表格、图片、图表等。 使用 GeneralAgent lib 与 OpenAI API 交互。 每页平均价格:0.013 美元 pdfgpt-ui 是一个基于 gptpdf 的可视化工具。 处理流程 使用 PyMuPDF 库,对 PDF 进行解析出所有非文本区域,并做好标记,比如: 使用视觉大模型(如 GPT-4o)进行解析,得到 markdown 文件。 样例 有关 PDF,请参阅 examples/attention_is_all_you_need/output.md 安装 pip install gptpdf 使用 from  gptpdf  import  parse_pdf api_key =  'Your OpenAI API Key' content, image_paths = parse_pdf(pdf_path, api_key=api_key) print(content) 更多内容请见 test/test.py API def parse_pdf(         pdf_path: str,         output_dir: str =  './' ,         prompt: Optional ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览