专栏名称: 百度AI
百度AI最新产品、产业案例、实时资讯在这里。 百度是为数不多进行全栈布局的人工智能公司。从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,各个层面都有领先业界的关键自研技术,可以实现端到端优化,大幅提升效率。
今天看啥  ›  专栏  ›  百度AI

PP-ChatOCRv3新升级:多页PDF信息抽取支持自定义提示词工程,拓展大语言模型功能边界

百度AI  · 公众号  ·  · 2025-02-20 18:00
    

文章预览

文本图像信息抽取技术在自动化办公、建筑工程、教育科研、金融风控、医疗健康等行业领域具有广泛应用场景。2024年9月,飞桨低代码开发工具 PaddleX 中新增文本图像智能产线 PP-ChatOCRv3, 充分结合 PaddleOCR  的 文本图像版面解析能力和文心一言语言理解优势,实现了高效的文本图像信息抽取。 近期,飞桨研发团队对飞桨低代码开发工具 PaddleX 中文本图像智能产线 PP-ChatOCRv3进行升级,一方面实现了基于标准 OpenAI 接口的大语言模型调用,支持不同类型大模型灵活更换,另一方面针对文本图像信息抽取,丰富了自定义提示词工程的能力,从而为文本图像信息抽取注入新动力。 PP-ChatOCRv3系统流程图 PP-ChatOCRv3进阶使用传送门 https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-rc/docs/practical_tutorials/document_scene_information_extraction(deepseek)_tutorial.md  本次升级具体特色 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览