专栏名称: OpenMMLab
构建国际领先的人工智能开源算法平台
目录
相关文章推荐
木紫午盘  ·  12月26日 大涨在即! ·  23 小时前  
木紫午盘  ·  12月26日 大涨在即! ·  23 小时前  
虎哥财局  ·  一盆冷水泼下来 ·  3 天前  
今天看啥  ›  专栏  ›  OpenMMLab

直播预告丨热门开源工具MinerU详解:助力复杂PDF/网页高效解析提取

OpenMMLab  · 公众号  ·  · 2024-09-02 18:11
    

文章预览

【社区开放麦】开播啦!!!技术下饭番追起来,每周一个新芝士。欢迎广大社区同学加入直播间参与讨论的同时,也非常鼓励社区同学拿起话筒登上舞台,社区知识开放麦等你来玩~ 本期精彩 大模型时代,高质量的语料数据是训练和微调环节不可缺少的一环,然而 AI 研究者常常面临着从海量文档中提取高质量数据的挑战。如何从格式、排版纷繁复杂的学术文献、行业报告、课本、试卷、网页、书籍等文档中,快速、智能地解析、抽取正式内容,提高 AI 语料准备效率?如何助力各行业利用大模型、RAG 等技术,结合专业文档,打造垂直领域的新知识引擎? 本次社区开放麦,我们邀请到上海人工智能实验室大模型数据基座 OpenDataLab 数据提取工程师 赵小蒙,他将为我们分享大模型研发与应用的全链条工具体系之数据提取方案及热门开源工具 MinerU。 Mi ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览