专栏名称: 智源社区
【智源社区】是北京智源人工智能研究院打造的一个内行、开放的 AI 实名社区,致力于促进 AI 交流。
今天看啥  ›  专栏  ›  智源社区

活动报名|从「看不懂」到「会操作」,人物交互技术如何改变未来机器人

智源社区  · 公众号  ·  · 2025-03-03 15:00
    

文章预览

报告主题: 面向复杂场景, 数字人交互理解与动作生成 报告日期: 03 月06日(本周四)10:30-11:30 报告要点: 人-物交互(HOI)是计算机视觉和机器人领域的核心挑战之一,旨在使机器能够理解和执行与物体的自然交互。 随着深度学习技术的进步,HOI研究在感知、规划与执行三个关键环节取得了显著进展。 本次讲座将深入探讨如何从真实数据中学习人-物交互,并展示一系列创新方法。 首先,我们提出了一种基于单目视觉的铰接物体重建方法,通过交互先验模型精确捕捉人体与物体之间的细粒度交互关系。 其次,我们介绍了一种基于自回归扩散模型的实时动作合成技术,能够根据关键点和场景信息生成灵活的人-场景交互动作,并具备卓越的零样本泛化能力。 最后,我们展示了一个基于大语言模型的HOI动作生成框架,能够从文本指令中自主合成多阶 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览