专栏名称: 宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
今天看啥  ›  专栏  ›  宝玉xp

最近有个朋友跟我讨论技术问题,他在用个第三方的OCR的服务,用来-20240823130616

宝玉xp  · 微博  · AI  · 2024-08-23 13:06

文章预览

2024-08-23 13:06 本条微博链接 最近有个朋友跟我讨论技术问题,他在用个第三方的OCR的服务,用来提取发票上的文字为结构化数据。但收费较高,想自己实现一套,试了开源的PaddleOCR,识别可以,但是无法转成结构化的数据。 我建议他试试多模态的LLM,比如Gemini 1.5 Flash,用来做 OCR 效果非常好,可以在 Prompt 里面定制要输出的格式,并且成本极低。 参考提示词: *** Extract text from the provided image and organize it into a structured JSON f ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览