豆包大模型排名第一，多模态能力获得三项第二

云头条 · 公众号 · · 2024-12-23 23:47

文章预览

2024 年 12 月 19 日，智源研究院发布最新一期大模型综合及专项评测结果。在覆盖国内外 100 余个开源和商业闭源大模型的评测中，豆包通用模型 pro 获得大语言模型主观评测最高分。在多模态模型评测中，豆包视觉理解模型排名视觉语言模型第二，成绩仅次于GPT-4o。豆包文生图模型、豆包视频生成模型（即梦 P2.0 pro）也分别在相应测试中获得全球第二。据智源研究院介绍，大模型评测平台 FlagEval 联合了全国 10 余家高校和机构合作共建。此次公布的榜单中，大语言模型主观评测重点考察的是模型的中文能力，多模态模型评测榜单中，视觉语言模型主要考察的是模型在图文理解、长尾视觉知识、文字识别以及复杂图文数据分析能力。 FlagEval 大模型角斗场则是向用户开放的模型对战评测服务，反映了用户对模型的偏好。在大语言模型主观评测中， ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博