文章预览
点击👇 “ LaTeX工作室 ” 关注公众号 精致美好科研生活 从 LaTeX 开始! 该项目为一个基于 PyTorch 的光学字符识别(OCR)模型,用于从图像中识别 LaTeX 代码,包含自定义数据集生成、模型训练与评估功能。项目提供了一个基于 FastAPI 后端的 Web 应用,用于快速预测图像中的 LaTeX 代码。 模型架构 :模型采用常见的编码器 - 解码器架构,基于 TrOCR 模型,使用 Vision Transformer(ViT)编码器和 Transformer 解码器。编码器将 LaTeX 方程图像转换为一系列嵌入向量,解码器根据这些嵌入向量和标记化的 LaTeX 代码序列生成概率分布,以自回归方式生成预测结果。 安装步骤 克隆仓库: git clone https://github.com/olibridge01/TeXOCR.git 并进入目录。 创建 conda 环境并安装依赖: conda create -n texocr python=3.11 anaconda , conda activate texocr , pip install -r requirements.txt 。 安装数据集渲染
………………………………