专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
今天看啥  ›  专栏  ›  老刘说NLP

RAG文档处理中的数值图表和流程图如何解析?从表示方式到代表解决方案

老刘说NLP  · 公众号  ·  · 2024-11-11 08:56

文章预览

今天是2024年11月11日,星期一,北京,天气雾。 我们从今天起,得换个写法,回归到实际场景业务,谈谈一些解决方案的话题。 最近琢磨的事情,就是现在很多文档场景,其实本质上都是做的数字化的过程,核心是从不可编辑到可编辑,比如常见的表格解析、文档转markdown、docx等。 今天,我们来看看一个比较有趣的话题, 这其实是RAG中的一些图表的解析方案, 讲讲数值图表的解析以及流程图的解析。 一些很有趣的思路,供大家一起参考。 一、先说数值图表的解析 而进一步的,其实,文档还是会有流程图、柱状图等数值图表,也有一些其他图片。 其中, 对于柱状图等数值图,目前已经有了很多将柱状图转为底层json_dict的方案 ,比如onechart(https://arxiv.org/pdf/2404.09987)、unichart(https://arxiv.org/pdf/2305.14761 ) 等。其核心是通过构造的输入输出对,然后丢 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览