专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
今天看啥  ›  专栏  ›  黄建同学

llm_aided_ocr,通过应用大型语言模型 (LLM) 校-20240824162402

黄建同学  · 微博  · AI  · 2024-08-24 16:24

文章预览

2024-08-24 16:24 本条微博链接 llm_aided_ocr,通过应用大型语言模型 (LLM) 校正来增强扫描 PDF 的 Tesseract OCR 输出↓ #ai# #程序员# 项目:github.com/Dicklesworthstone/llm_aided_ocr 特点: • PDF 到图像转换 • 使用 Tesseract 进行 OCR • 使用 LLM(本地或基于 API)进行高级错误更正 • 智能文本分块,高效处理 • Markdown 格式选项 • 抑制页眉和页码(可选) • 最终输出的质量评估 • 支持本地 LLM 和基于云的 API 提供商(OpenAI、Anthropic) • 异 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览