文章预览
↑ 点击 蓝字 关注极市平台 编辑丨极市平台 极市导读 本综述 对 200个多模态大模型评测集进行了全面 的 回顾 和总结 , 涵盖了MLLM评估的五个关键领域 : (1) 感知和理解,(2) 认知和推理,(3) 特定领域,(4) 关键能力,以及 (5) 其他模态 ,共包括20-30个详细类别。 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 arxiv论文: https://arxiv.org/pdf/2408.08632 主页: https://github.com/swordlidev/Evaluation-Multimodal-LLMs-Survey 多模态大语言模型因其在视觉感知和问答、理解和推理等各种应用中的卓越表现,正在学术界和工业界获得越来越多的关注。在过去的几年中,大量的研究人员从各种维度和粒度对MLLM (Multimodal Large Language Model)进行了深入研究。本综述对200个多模态大模型评测集进行了全面的回顾和总结,涵盖了MLLM评估的五个关键领域:(1) 感知和理解,(2) 认知
………………………………