今天看啥  ›  专栏  ›  机器学习研究组订阅

中文准确率97%,OCR新王登场?1美元处理2000页文档,速度惊人

机器学习研究组订阅  · 公众号  · AI  · 2025-03-07 18:45
    

文章预览

Mistral AI今日发布了堪称「世界上最好」的OCR模型,登顶Hacker News热榜。 它以图像和PDF作为输入,能以前所未有的认知能力,准确理解文档中的每个元素(图像、文本、表格和公式)。 它是与RAG系统结合使用的理想模型,适用于幻灯片或复杂PDF等文档的处理。 Le Chat已将其设为默认的文档理解模型,同时发布的API「mistral-ocr-latest」1美元可处理1000页(批量推理时每页成本约减半)。 API现已在开发者套件la Plateforme上提供,很快将在云服务、推理合作伙伴以及本地环境中部署。 网友表示,谷歌和Azure OCR迎来了严峻的挑战。 然而,也有网友不买账,对官方测试结果提出了质疑。 实测发现,模型在处理财务和法律文件时,仍存在精度问题。 Mistral OCR亮点 前沿的复杂文档理解能力 以往的OCR技术对于穿插的图像、数学表达式、表格以及高级布局(如LaTeX)的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览