文章预览
机器之心报道 机器之心编辑部 近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。 最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v,仅次于 GPT-4o(69.9)和 Claude3.5-Sonnet(67.9)。 而在国内市场,从容大模型的成绩也超过了 InternVL-Chat(61.7)和 GLM-4V(60.8),排名首位。 图 1:OpenCompass 多模态榜单 OpenCompass 大模型开放评测体系是上海人工智能实验室推出的完整开源可复现的评测框架。OpenCompass 多模态评测方面采用了 8 个具有代表性的数据集,从多种视角客观量化多模态大模型的能力,评估维度覆盖目标检测、文字识别、动作识别、图像理解和关系推理、艺术与设计、商业、科学、健康与医学、人文与社会
………………………………