专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
今天看啥  ›  专栏  ›  专知

CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

专知  · 公众号  ·  · 2025-04-12 11:00
    

文章预览

转载机器之心 GEAL 由新加坡国立大学的研究团队开展,第一作者为博士生鲁东岳,通讯作者为该校副教授 Gim Hee Lee,团队其他成员还包括孔令东与黄田鑫博士。 主页:https://dylanorange.github.io/projects/geal/ 论文:https://arxiv.org/abs/2412.09511 代码:https://github.com/DylanOrange/geal 在现实世界中,如何让智能体理解并挖掘 3D 场景中可交互的部位(Affordance)对于机器人操作与人机交互至关重要。所谓  3D Affordance Learning ,就是希望模型能够根据视觉和语言线索,自动推理出物体 可供哪些操作、以及可交互区域的空间位置 ,从而为机器人或人工智能系统提供对物体潜在操作方式的理解。 与 2D 任务相比,3D 数据的获取与高精度标注通常更为困难且成本高昂,这使得大规模高质量的 3D 标注数据 十分稀缺 ,也阻碍了模型在新物体或场景中的泛化。与此同时,现有 3D 多 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览