专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
今天看啥  ›  专栏  ›  老刘说NLP

大模型虚假内容检测及Text2SQL数据合成思路:昨日技术及项目进展回顾

老刘说NLP  · 公众号  ·  · 2024-08-18 09:05
    

文章预览

今天是2024年8月18日,星期日,北京,天气晴。 我们今天看2个事情。一个是回顾昨日大模型进展早报,一个是看看Text2SQL的一个数据合成工作,会有一些思路。 供大家一起参考并思考。 一、回顾昨日大模型进展早报 社区早报,总结过去一日关键进展,围绕RAG、知识图谱、大模型、长文本的一些进展。 当前,转眼间社区早报已经实行6个月,近180天每日大模型、知识图谱、RAG等动向,信息量挺大,蛮有意义的。 文字版本可见社区,欢迎加入社区,一同共享。 我们来看下昨日大模型进展,主要涉及关于文档处理进展。 将Markdown文档转换为幻灯片的开源工具,将PPT转换为Markdown文件,LLM/MLLM模型融合,MixTeX多模态LaTeX OCR工具,爬虫网页解析,大模型数据合成,大模型内容检测 ,用Agent做Text-SQL之MAG-SQL及长文本生成多个主题,可以多看看。 其中现在大模 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览