专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

Gemini大考终于赢了GPT-4o！Jeff Dean连续转发三次！Video-MME首个视频多模态基准来了！

AINLP · 公众号 · · 2024-06-19 18:21

文章预览

近日，中科大、厦大、港中文等高校联合推出多模态大模型视频分析综合评估基准 Video-MME，全面评估多模态大模型的综合视频理解能力，填补了这一领域的空白。Gemini 1.5 Pro在这份榜单中遥遥领先，证明其在视频理解领域的霸主地位。Video-MME一经推出，更是被谷歌首席科学家Jeff Dean连续转发了三次！目前已有近30万的浏览量，热度很高。 GPT-4o的伟大已无需多言，而谷歌的Gemini 1.5 Pro作为挑战者，其标榜的视频推理能力终于在全新的、更复杂的多模态基准Video-MME上首次得到了验证，并全面超越了GPT-4o！同时，各大公司以及研究机构，例如NVIDIA、ByteDance等模型也加入了混战：榜单一经放出，Jeff Dean也在第一时间进行了转发表示称赞，共连续转发了三次。在先前的研究中，缺少可以全面评估大模型视频推理能力的基准。而在现实世界中，处理视频能 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博