文章预览
项目简介 超高精度将图像或 PDF 转换为 Markdown 文本或 JSON 结构化文档,包括表格数据、数字或数学公式。该 API 由 FastAPI 构建,同时借助 Celery 实现异步任务处理。还使用 Redis 存储和缓存 OCR 结果,以提高效率。 特征 无需云/外部依赖项 即可满足您的所有需求:基于 PyTorch 的 OCR(标记)+ Ollama 通过 docker-compose 进行运输和配置,不会将数据发送到您的开发/服务器环境之外, 使用不同的 OCR 策略(包括标记、 surya-ocr或tessereact)以非常高的准确度 将 PDF 转换为 Markdown 使用 Ollama 支持的模型(例如 LLama 3.1)将 PDF 转换为 JSON LLM改善 OCR 结果 LLama 非常擅长修复 OCR 文本中的拼写和文本问题 删除 PII 该工具可用于从 PDF 中删除个人身份信息 - 请参阅 examples 使用[Celery]进行 分布式队列处理 ( ) 使用 Redis 进行 缓存 - 在LLM处理之前可以轻松缓存 OCR 结果 用于发送
………………………………