讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

EPIC-KITCHENS 数据集

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-11-18 00:33
    

文章预览

20年4月来自英国Bristol大学、加拿大多伦多大学、意大利Catania和Nvidia的论文“The EPIC-KITCHENS Dataset: Collection, Challenges and Baselines”。 自 2018 年推出以来,EPIC-KITCHENS 就作为最大的以自我为中心的视频基准而备受关注,它为人们与目标的互动、注意甚至意图提供了独特的视角。本文详细介绍 32 名参与者如何在他们自己的厨房环境中捕获这个大规模数据集,并密集地注释动作和目标交互。这些视频描述了非脚本化的日常活动,因为每次参与者进入他们的厨房时都会开始录制。录制由来自 10 个不同国籍的参与者在 4 个国家/地区进行,因此厨房习惯和烹饪风格高度多样化。该数据集包含 55 小时的视频,由 11.5M 帧组成,对其进行了密集标注,总共有 39.6K 个动作片段和 454.2K 个目标边框。其标注是独一无二的,因为让参与者讲述他们自己的视频(录制后),从 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览