专栏名称: 魔搭ModelScope社区
阿里巴巴达摩院模型开源社区ModelScope官方账号
今天看啥  ›  专栏  ›  魔搭ModelScope社区

阶跃星辰开源GOT-OCR2.0:统一端到端模型,魔搭一站式推理微调最佳实践来啦!

魔搭ModelScope社区  · 公众号  ·  · 2024-09-25 18:00

文章预览

01 引言 OCR技术在将现实世界中的文本信息转换为可编辑、可搜索的数据方面发挥着至关重要的作用,它桥接着物理世界与数字世界,是实现信息自动化处理的关键技术。作为AI-1.0时代的技术成果,OCR技术已经相对成熟,被广泛应用于文档管理、自动驾驶、智能监控等多个领域。 然而,随着技术的发展和应用需求的提升,OCR 1.0技术逐渐展现出局限性。传统OCR系统在处理复杂场景、模糊图像或特殊字体时,准确率和效率往往不尽人意。此外,随着AI进入以LLM(Large Language Models)为核心的AI-2.0时代,对OCR技术提出了更高的要求,不仅仅是文本识别,还需要与多模态能力相结合,实现更为丰富的信息提取和理解。 因此,OCR-2.0应运而生,该模型由 阶跃星辰多模态团队 开源。GOT-OCR2.0将所有的人工光学信号(例如文本、数学/分子公式、表格、图表、乐谱甚 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览