专栏名称: 百度AI
百度AI最新产品、产业案例、实时资讯在这里。 百度是为数不多进行全栈布局的人工智能公司。从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,各个层面都有领先业界的关键自研技术,可以实现端到端优化,大幅提升效率。
今天看啥  ›  专栏  ›  百度AI

PaddleOCR 2.9 发布,正式开源文本图像智能分析利器

百度AI  · 公众号  · 科技创业 科技自媒体  · 2024-10-22 18:00

主要观点总结

介绍PaddleOCR最新发版带来的两大重磅升级内容以及相关特点和优势。

关键观点总结

关键观点1: PaddleOCR项目简介及最新发版情况

PaddleOCR是一个OCR方向的项目,目前累计Star数量超过43k+,安装包月下载量超过40w+。最新发版带来了两大重磅升级。

关键观点2: 文档场景信息抽取v3开源版的特点

本次升级中,发布了文档场景信息抽取v3开源版,大幅提升了文本图像版面解析能力,信息抽取整体效果相比上一个版本提升6%,同时新增了7个实用的OCR基础模型。

关键观点3: OCR领域低代码全流程开发能力

PaddleOCR通过极简的Python API一键调用17个OCR相关模型,支持基于统一命令和图形界面两种方式,实现模型简洁高效的使用、组合与定制。支持各种主流硬件无缝切换,提供完整的产线开发流程文档。

关键观点4: 精彩课程预告

为了帮助您了解PaddleOCR最新版本并熟练掌握全流程操作技巧,百度资深研发工程师将于10月24日进行课程讲解,同时还有针对PP-ChatOCRv3-doc开源版的产业场景实战营。


文章预览

OCR 方向的工程师,之前一定听说过 PaddleOCR 这个项目。目前项目累计 Star 数量已超过43k+ ,安装包月下载量超过40w+ 。 滑动查看更多图片 本次 PaddleOCR 最新发版,带来 两大重磅升级 ,包括: 发布文档场景信息抽取 v3(PP-ChatOCRv3-doc)开源版,大幅提升了文本图像版面解析能力,充分发挥文心一言语言理解优势,信息抽取整体效果相比于上一个版本提升6%,同时新增7个实用的 OCR 基础模型。 支持 OCR 领域低代码全流程开发能力,通过极简的 Python API 一键调用17个 OCR 相关模型,提供基于统一命令和图形界面两种方式,实现模型简洁高效的使用、组合与定制。支持各种主流硬件如英伟达 GPU、昆仑芯、昇腾和寒武纪无缝切换。 PaddleOCR 代码库地址,欢迎大家 star: https://github.com/PaddlePaddle/PaddleOCR PP-ChatOCRv3-doc 在线体验地址: https://aistudio.baidu.com/community/ ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览