专栏名称: CVer
一个专注侃侃计算机视觉方向的公众号。计算机视觉、图像处理、机器学习、深度学习、C/C++、Python、诗和远方等。
今天看啥  ›  专栏  ›  CVer

时空理解全新基准!STI-Bench:评估MLLMs的精确时空理解能力

CVer  · 公众号  ·  · 2025-04-11 23:59
    

文章预览

点击下方 卡片 ,关注“ CVer ”公众号 AI/CV重磅干货,第一时间送达 点击进入—> 【顶会/顶刊】投稿交流群 添加微信号:CVer2233,小助手会拉你进群! 扫描下方二维码,加入CVer学术星球 ! 可以获得最新顶会/顶刊上的论文idea 和 CV从入门到精通资料,及最前沿应用 !发论文/搞科研/涨薪,强烈推荐! 上交、NTU、BAAI、斯坦福等:  论文标题: STI-Bench: Are MLLMs Ready for Precise Spatial-Temporal World Understanding?  论文:  https://arxiv.org/abs/2503.23765 主页:  https://mira-sjtu.github.io/STI-Bench.io/ MLLMs 真的具备精确时空理解能力吗?  当前,将多模态大模型(MLLM)作为具身智能和自动驾驶的端到端方案已成趋势。但这些模型在理解语义之外,是否真正具备了对现实世界精确、定量的时空理解能力?这直接关系到它们在物理世界中行动的可靠性。 作者们认为,现有对MLLM的评 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览