文章预览
7月4日下午,世界人工智能大会科学前沿论坛, 我们发布了InternVL 2.0,中文名称为"书生·万象”,相比业内公认的 最强多模态大模型InternVL-1.5 ,能力又上新台阶。它在 关键评测指标比肩国际顶尖商用闭源模型,支持图像、视频、文本、语音、三维、医疗多种模态,百种下游任务性能媲美任务专用模型。 同时,书生万象也是 国内首个在MMMU(多学科问答)上突破60的模型,堪称 开源多模态大模型性能新标杆 。数学基准MathVista的测试中、书生万象的得分为66.3%, 显著高于 其他闭源商业模型和开源模型。在通用图表基准ChartQA、文档类基准DocVQA、信息图表类基准InfographicVQA中以及通用视觉问答基准MMBench (v1.1)中,书生万象也取得了 最先进(SOTA) 的表现。科学图表基准AI2D的测试中,书生万象 大幅领先 其他优秀的开源模型,并 与商业闭源模型不相上下 。 图
………………………………