专栏名称: AI算法与图像处理
考研逆袭985,非科班跨行AI,目前从事计算机视觉的工业和商业相关应用的工作。分享最新最前沿的科技,共同分享宝贵的资源资料,这里有机器学习,计算机视觉,Python等技术实战分享,也有考研,转行IT经验交流心得
今天看啥  ›  专栏  ›  AI算法与图像处理

InternVL 2.0:多模态大模型新标杆

AI算法与图像处理  · 公众号  ·  · 2024-07-12 23:45

文章预览

7月4日下午,世界人工智能大会科学前沿论坛, 我们发布了InternVL 2.0,中文名称为"书生·万象”,相比业内公认的 最强多模态大模型InternVL-1.5 ,能力又上新台阶。它在 关键评测指标比肩国际顶尖商用闭源模型,支持图像、视频、文本、语音、三维、医疗多种模态,百种下游任务性能媲美任务专用模型。 同时,书生万象也是 国内首个在MMMU(多学科问答)上突破60的模型,堪称 开源多模态大模型性能新标杆 。数学基准MathVista的测试中、书生万象的得分为66.3%, 显著高于 其他闭源商业模型和开源模型。在通用图表基准ChartQA、文档类基准DocVQA、信息图表类基准InfographicVQA中以及通用视觉问答基准MMBench (v1.1)中,书生万象也取得了 最先进(SOTA) 的表现。科学图表基准AI2D的测试中,书生万象 大幅领先 其他优秀的开源模型,并 与商业闭源模型不相上下 。 图 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览