今天看啥  ›  专栏  ›  ADFeed

TableGPT2:用于处理表格数据集成的大型多模态模型技术

ADFeed  · 公众号  ·  · 2024-11-08 11:15
    

文章预览

TableGPT2: A Large Multimodal Model with Tabular Data Integration 代码: https://github.com/tablegpt/tablegpt-agent 论文: https://arxiv.org/abs/2411.02059 TableGPT2  是一个创新的大型多模态模型,专门针对表格数据的集成和处理进行了优化。 TableGPT2 通过预训练和微调超过593.8K表格和2.36M高质量的查询-表格-输出元组,显著提升了模型在表格相关任务上的性能。 该模型的一大特点是其新颖的语义表格编码器,能够捕捉表格的架构级和单元格级信息,从而增强模型处理现实世界中模糊查询、缺失列名和不规则表格的能力。 TableGPT2 在多个基准测试中展现了卓越的性能,相较于以往的模型,在7B和72B版本上分别实现了平均35.20%和49.32%的性能提升,同时保持了强大的通用能力。 此外,该研究还提供了一个开源的代码库,包括模型和全面的代理工作流程,以及RealTabBench数据集的一部分,以 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览