专栏名称: 云头条
引领科技变革,连接技术与商业
目录
相关文章推荐
今天看啥  ›  专栏  ›  云头条

豆包大模型排名第一,多模态能力获得三项第二

云头条  · 公众号  ·  · 2024-12-23 23:47
    

文章预览

2024 年 12 月 19 日,智源研究院发布最新一期大模型综合及专项评测结果。 在覆盖国内外 100 余个开源和商业闭源大模型的评测中,豆包通用模型 pro 获得大语言模型主观评测最高分。 在多模态模型评测中,豆包视觉理解模型排名视觉语言模型第二,成绩仅次于GPT-4o。 豆包文生图模型、豆包视频生成模型(即梦 P2.0 pro)也分别在相应测试中获得全球第二。 据智源研究院介绍,大模型评测平台 FlagEval 联合了全国 10 余家高校和机构合作共建。 此次公布的榜单中,大语言模型主观评测重点考察的是模型的中文能力,多模态模型评测榜单中,视觉语言模型主要考察的是模型在图文理解、长尾视觉知识、文字识别以及复杂图文数据分析能力。 FlagEval 大模型角斗场则是向用户开放的模型对战评测服务,反映了用户对模型的偏好。 在大语言模型主观评测中, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览