专栏名称: 宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
今天看啥  ›  专栏  ›  宝玉xp

回复@青年小哲:更新了原文说明了图片如何处理的//@青年小哲:图-20240630140013

宝玉xp  · 微博  · AI  · 2024-06-30 14:00
2024-06-30 14:00 本条微博链接 回复@青年小哲:更新了原文说明了图片如何处理的//@青年小哲:图片是咋处理的 #AI开源项目推荐#: CosmosShadow/gptpdf这个将 PDF 转换成 Markdown 的做法很聪明,先使用 PyMuPDF 库,对 PDF 进行解析出所有非文本区域,并做好标记;然后使用视觉大模型(如 GPT-4o)进行解析,得到 markdown 文件。每页平均价格:0.013 美 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照