文章预览
来源:腾讯混元 8月2日,腾讯混元大模型凭借多模态理解方面的卓越表现,在中文多模态大模型SuperCLUE-V测评基准8月榜单中脱颖而出, 斩获国内大模型排名第一,稳居卓越领导者象限 。 多模态理解,俗称“图生文”,要求模型能准确识别图像元素,理解它们的关系,并生成自然语言描述 。这既考验图像识别的精确度,也体现了对场景的全面理解、对细节的深度洞察,考验模型对复杂现实世界的理解力。 本次测评涵盖了国内外最具代表性的12个多模态理解大模型,包含4个海外模型和8个国内代表性多模态模型,评估内容包含基础能力和应用能力两大方向,以开放式问题对多模态大模型进行评估。腾讯混元大模型在多模态基础能力和应用能力方面,获得总分 71.95 的高分,显示出在技术和应用层的综合优势。 据SuperCLUE官方介绍,评估标准涵盖了理解
………………………………