NeurIPS D&B 2024 | 突破短视频局限！MMBench-Video全面解读MLLM视频理解能力

魔搭ModelScope社区 · 公众号 · · 2024-11-07 18:28

文章预览

GPT-4o 四月发布会掀起了视频理解的热潮，而开源领军者Qwen2也对视频毫不手软，在各个视频评测基准上狠狠秀了一把肌肉。但当前的大部分评测基准仍然具有以下几个缺陷： 1、多注重于短视频，视频长度或视频镜头数不足，难以考察到模型的长时序理解能力。 2、对模型的考察局限在部分较为简单的任务，更多细粒度的能力未被大部分基准所涉及到。 3、现有的基准仍可以仅凭单帧图像以获取较高的分数，说明问题和画面的时序性关联不强。 4、对开放性问题的评估仍旧采用较旧的GPT-3.5 ，打分和人类偏好有较大的偏差且并不准确，容易高估模型性能。针对这些问题，有没有对应的基准能够较好解决这些问题呢？还真有！在最新的 NeurIPS D 2024 中，由浙江大学联合上海人工智能实验室，上海交通大学和香港中文大学提出的 MMBench-Video 打造了一 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

LeaderCareer · 重磅：THE2025世界大学声誉排名发布！10所英国大学跻身世界Top100

17 小时前

中国电信 · 公开招聘！量子起航！

21 小时前

北美留学生观察 · 震惊！华人换汇公司女员工被控挪用$440万逃回中国？豪掷千万购房产！

昨天

北美留学生观察 · “抱歉，你的港大offer正在被撤回。”香港25fall录取超额，英美紧急撤销offer，大批学生被迫gap？

昨天

北美留学生观察 · 藤校招生官怒了！“十名中国申请者中，至少我有七个不信任”

昨天

科普中国 · 数字背后的股市“掌舵手”到底是什么？

8 月前

半导体行业圈 · 给半导体人强推的5个公众号！

3 月前

爱写作的狮子 · “新春在路上”主题征集活动火热进行中！

2 周前