文章预览
作者主页: https://bit-mjy.github.io/ https://xieyuanli-chen.com/ 论文标题: MADiff: Motion-Aware Mamba Diffusion Models for Hand Trajectory Prediction on Egocentric Videos ▲视频|MADiff能够在第一人称视频中准确预测手部未来的轨迹。 在具身人工智能(Embodied AI)领域,如何实现对人类行为和意图的深入理解以及灵活的迁移应用是一个关键问题。通过大规模互联网视频提取可重复利用和迁移的知识,被认为是理解人类意图和动作的高效途径。许多研究已经在动作识别、动作预测、注视点预测、物体交互预测等方向取得进展。 然而,手部轨迹预测(HTP)仍然是其中一个具有挑战性的任务,目标是预测未来人类的动作,而不仅仅是识别动作类别或注视点。HTP技术对于机器人学习中的动作空间表示和扩展现实中的人类活动辅助具有重要价值。现有的基于卷积和Trasnformer的模型尽管取得
………………………………