上海微系统所在视觉三维人体姿态估计研究方面取得进展

MEMS · 公众号 · 科技自媒体 · 2024-07-28 00:00

主要观点总结

中国科学院上海微系统与信息技术研究所仿生视觉系统实验室李嘉茂研究员团队在视觉三维人体姿态估计领域取得重要进展，成果被European Conference on Computer Vision (ECCV) 2024录用。该团队解决了三维人体姿态估计中的投影模型误差和姿态Z轴整体反向问题，提出了旋转正交投影模型和关节反向约束，在Human3.6M数据集上达到最优性能。该研究得到多项项目支持。

关键观点总结

关键观点1: 研究背景及重要性

三维人体姿态估计是机器视觉理解人体动作的关键技术，广泛应用于虚拟现实、运动分析、人机交互等领域。由于直接获得高精度的三维人体姿态成本较高，机器视觉领域常采用自监督学习方法。

关键观点2: 主要挑战及问题

在自监督学习中，重投影一致性是实现3D人体姿态估计的关键，但现有研究存在投影模型误差和缺乏对Z轴方向的有效约束等问题。

关键观点3: 研究内容及创新点

针对上述问题，团队提出了旋转正交投影模型、分组旋转正交投影方法和关节反向约束，缩小了与透视投影模型的误差，并弥补了二维监督的不足。该研究在Human3.6M数据集上达到了最优性能，平均误差为42.9毫米。

关键观点4: 研究支持及作者

该研究得到科技部科技创新2030、国家自然科学基金、上海市自然基金、中国科学院青促会、上海市优秀学术带头人等项目支持。上海微系统所仿生视觉系统实验室研究生姚瑶为论文第一作者，李嘉茂研究员为通讯作者。

文章预览

近日，中国科学院上海微系统与信息技术研究所仿生视觉系统实验室李嘉茂研究员团队在视觉三维人体姿态估计领域取得了重要进展。题目为“Rotated Orthographic Projection for Self-Supervised 3D Human Pose Estimation”的成果被机器视觉领域顶级三大国际学术会议之一European Conference on Computer Vision（ECCV）2024录用。三维人体姿态估计是机器视觉理解人体动作的关键技术，在虚拟现实、运动分析、人机交互等领域有着广泛应用。直接获得高精度的三维人体姿态成本较高，机器视觉领域往往利用人工神经网络进行自监督学习，从多视角的二维图像中预测三维人体姿态。重投影一致性，是实现自监督学习3D人体姿态的关键。其主要思想是，由虚拟相机从与预测到的3D人体姿态拍摄到的2D人体姿态，应该与输入图像中直接得到的2D人体姿态一致。在实际操作中，输入图像的2 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博