文章预览
论文信息 题目:PoseScript: Linking 3D Human Poses and Natural Language PoseScript:将三维人体姿态与自然语言相链接 作者:Ginger Delmas; Philippe Weinzaepfel; Thomas Lucas; Francesc Moreno-Noguer; Grégory Rogez 源码链接:https://europe.naverlabs.com/research/computer-vision/posescript/ 论文创新点 提出了 PoseScript数据集 ,这是第一个将3D人体姿势与自然语言描述相链接的数据集。该数据集通过结合 6,000多个3D人体姿势 与丰富的人工标注描述; 通过一个精心设计的 自动字幕流程 生成的自然语言描述,显著扩展了数据集的规模,达到了100,000个姿势描述。这一流程不仅提高了数据的多样性,而且使得数据集能够与数据密集型学习算法兼容,为 预训练深度模型 提供了可能。 此外,本文还提出了三个多模态学习任务,展示了PoseScript数据集的潜力和应用范围: 摘要 自然语言在许多计算机视觉应用中
………………………………