专栏名称: 宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
今天看啥  ›  专栏  ›  宝玉xp

问:参加展会,需要将展会信息扫描成PDF然后做OCR,但是手工摘-20240902124431

宝玉xp  · 微博  · AI  · 2024-09-02 12:44

文章预览

2024-09-02 12:44 本条微博链接 问:参加展会,需要将展会信息扫描成PDF然后做OCR,但是手工摘录供应商信息效率太低。尝试对PDF分割做分割后OCR,再让GPT识别生成文本字段,但是有些供应商字段不完整,无法直接输出到Excel,效率很低。该如何去改善?(参考图1) 答: OCR 建议使用 Gemini 模型,比GPT效果识别效果更好 没有必要预先对PDF预分割处理,整张图片直接发给 Gemini 就可以帮你自动识别不同厂商和各个字段 优先考虑 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览