文章预览
AIGC Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) Topic: Multi-modal|Urban Scenarios Benchmark, Versatile Scene Understanding UrBench: A Comprehensive Benchmark for Evaluating Large Multimodal Models in Multi-View Urban Scenarios UrBench 2024-08-30|Shanghai AI Lab, SYSU, SenseTime Research, WHU| 🟡 http://arxiv.org/abs/2408.17267v1 https://opendatalab.github.io/UrBench/ 概述 本研究提出了UrBench,这是一个 旨在全面评估大规模多模态模型(LMMs)在复杂的多视角城市场景中的能力的基准 。当前的LMMs评估主要集中在单一视角和简单的区域级任务上,导致在城市环境中对其能力的评估缺乏全面性和深入性。 UrBench通过整合来自11个城市的数据,并建立起多达11600个经过精心策划的问题,涵盖地理定位、场景推理、场景理解和物体理解等四个任务维度及14种任务类型 ,弥补了这一缺陷。对21种LMMs的评估结
………………………………