文章预览
今天是2024年11月11日,星期一,北京,天气雾。 我们从今天起,得换个写法,回归到实际场景业务,谈谈一些解决方案的话题。 最近琢磨的事情,就是现在很多文档场景,其实本质上都是做的数字化的过程,核心是从不可编辑到可编辑,比如常见的表格解析、文档转markdown、docx等。 今天,我们来看看一个比较有趣的话题, 这其实是RAG中的一些图表的解析方案, 讲讲数值图表的解析以及流程图的解析。 一些很有趣的思路,供大家一起参考。 一、先说数值图表的解析 而进一步的,其实,文档还是会有流程图、柱状图等数值图表,也有一些其他图片。 其中, 对于柱状图等数值图,目前已经有了很多将柱状图转为底层json_dict的方案 ,比如onechart(https://arxiv.org/pdf/2404.09987)、unichart(https://arxiv.org/pdf/2305.14761 ) 等。其核心是通过构造的输入输出对,然后丢
………………………………