专栏名称: 宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
今天看啥  ›  专栏  ›  宝玉xp

回复@赵云之剑:多模态理论上也可以生成表格的markdown的,-20240725084929

宝玉xp  · 微博  · AI  · 2024-07-25 08:49
    

文章预览

2024-07-25 08:49 本条微博链接 回复 @赵云之剑 :多模态理论上也可以生成表格的markdown的,但是OCR的时候表达结构化的数据会难一些// @赵云之剑 :图片不用ocr可以理解,为啥表格也不用ocr? #AI开源项目推荐# : CosmosShadow/gptpdf 这个将 PDF 转换成 Markdown 的做法很聪明,先使用 PyMuPDF 库,对 PDF 进行解析出所有非文本 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览