专栏名称: LaTeX工作室
欢迎光临分享与学习LaTeX的王国
今天看啥  ›  专栏  ›  LaTeX工作室

Image to LaTeX: 使用PyTorch进行光学字符识别的模型

LaTeX工作室  · 公众号  ·  · 2024-12-22 19:36
    

文章预览

点击👇 “ LaTeX工作室 ”  关注公众号 精致美好科研生活 从 LaTeX 开始! 该项目为一个基于 PyTorch 的光学字符识别(OCR)模型,用于从图像中识别 LaTeX 代码,包含自定义数据集生成、模型训练与评估功能。项目提供了一个基于 FastAPI 后端的 Web 应用,用于快速预测图像中的 LaTeX 代码。 模型架构 :模型采用常见的编码器 - 解码器架构,基于 TrOCR 模型,使用 Vision Transformer(ViT)编码器和 Transformer 解码器。编码器将 LaTeX 方程图像转换为一系列嵌入向量,解码器根据这些嵌入向量和标记化的 LaTeX 代码序列生成概率分布,以自回归方式生成预测结果。 安装步骤 克隆仓库: git clone https://github.com/olibridge01/TeXOCR.git 并进入目录。 创建 conda 环境并安装依赖: conda create -n texocr python=3.11 anaconda , conda activate texocr , pip install -r requirements.txt 。 安装数据集渲染 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览