专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

空间智能版ImageNet来了!李飞飞吴佳俊团队出品

量子位  · 公众号  · AI  · 2024-11-10 12:35

文章预览

衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队! HourVideo ,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。 通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。 2009年,李飞飞团队在CVPR上首次对外展示了图像识别数据集 ImageNet ,它的出现极大推动计算机视觉算法的发展——懂CV的都是知道这里面的门道有多深。 现在,随着多模态迅猛发展,团队认为“现有的视频基准测试,大多集中在特定领域或短视频上”,并且“这些数据集的平均视频长度较短,限制了对长视频理解能力的全面评估”。 于是,空间智能版ImageNet应运而生。 HourVideo包含500个来自Ego4D数据集的第一人称视角视频,时长在20到120分钟之间,涉及77种日常活动。 评测结果表示, 人类 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览