专栏名称: 菜鸟教程
学的不仅是技术,更是梦想!
目录
今天看啥  ›  专栏  ›  菜鸟教程

基于浏览器的 OCR,无需后端服务,支持 100 多种语言,支持视频识别

菜鸟教程  · 公众号  ·  · 2024-10-12 11:27

文章预览

今天给大家介绍一个有意思的开源项目 Tesseract.js ,它 是一个基于网页的 OCR 引擎,可以在浏览器和 Node.js 环境中运行。 Tesseract.js 是一个基于浏览器的 OCR(光学字符识别)库,它可以从图片中提取文本。该库使用 WebAssembly 来运行 Tesseract OCR 引擎,允许在前端 JavaScript 环境中进行图像文字识别,无需依赖后端服务器处理。Tesseract.js 支持多种语言,具有良好的扩展性和易于使用的 API。 主要功能: 跨平台支持:在浏览器和 Node.js 中都可以运行,方便在前端应用中直接使用 OCR。 多语言识别:支持包括中文、英语、法语等在内的 100 多种语言的文本识别。 异步处理:提供 Promise 和回调的异步 API,可以轻松处理长时间的图像处理任务。 图片预处理:支持对图像进行一些预处理操作(如灰度化、二值化等),提高识别准确率。 进度反馈:提供识别进度信 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览