一个百度人的技术提升之路,为您提供一系列计算机视觉,自然语言处理和推荐系统等高质量技术文章,让您的碎片化时间最大价值化
今天看啥  ›  专栏  ›  深度学习基础与进阶

TPAMI 2024 | PoseScript:将三维人体姿态与自然语言相链接

深度学习基础与进阶  · 公众号  ·  · 2024-11-20 20:08
    

文章预览

论文信息 题目:PoseScript: Linking 3D Human Poses and Natural Language PoseScript:将三维人体姿态与自然语言相链接 作者:Ginger Delmas; Philippe Weinzaepfel; Thomas Lucas; Francesc Moreno-Noguer; Grégory Rogez 源码链接:https://europe.naverlabs.com/research/computer-vision/posescript/ 论文创新点 提出了 PoseScript数据集 ,这是第一个将3D人体姿势与自然语言描述相链接的数据集。该数据集通过结合 6,000多个3D人体姿势 与丰富的人工标注描述; 通过一个精心设计的 自动字幕流程 生成的自然语言描述,显著扩展了数据集的规模,达到了100,000个姿势描述。这一流程不仅提高了数据的多样性,而且使得数据集能够与数据密集型学习算法兼容,为 预训练深度模型 提供了可能。 此外,本文还提出了三个多模态学习任务,展示了PoseScript数据集的潜力和应用范围: 摘要 自然语言在许多计算机视觉应用中 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览