文章预览
22年3月来自Facebook FAIR 为首等众多研究机构的论文“Ego4D: Around the World in 3,000 Hours of Egocentric Video”。 Ego4D 是一个大规模的自我中心视频数据集和基准套件。它提供了 3,670 小时的日常生活活动视频,涵盖数百种场景(家庭、户外、工作场所、休闲等),由来自全球 74 个地点和 9 个不同国家的 931 名独特相机拍摄者拍摄。收集方法旨在遵守严格的隐私和道德标准,并在相关情况下征得参与者同意并采用强大的 去识别程序 。Ego4D 极大地扩充各种自我中心视频片段的公开数量。视频的某些部分配有音频、环境的 3D 网格、眼神注视、立体声和/或来自同一事件的多个自我中心摄像机同步视频。此外,提出一系列新的基准挑战,主要围绕理解过去(查询情景记忆)、现在(分析手-物操控、视-听对话和社交互动)和未来(预测活动)的第一人称视觉体验。 当
………………………………