TPAMI 2024 | Vote2Cap-DETR++：解耦定位与描述的端到端3D密集描述

3D视觉之心 · 公众号 · · 2024-11-02 07:00

文章预览

作者 | 小研编辑 | 计算机书童点击下方卡片，关注“ 3D视觉之心 ”公众号第一时间获取 3D视觉干货 >> 点击进入→ 3D视觉之心技术交流群题目：Vote2Cap-DETR++: Decoupling Localization and Describing for End-to-End 3D Dense Captioning Vote2Cap-DETR++：解耦定位与描述的端到端3D密集描述作者：Sijin Chen; Hongyuan Zhu; Mingsheng Li; Xin Chen; Peng Guo; Yinjie Lei; Gang Yu; Taihao Li; Tao Chen 源码链接：https://github.com/ch3cook-fdu/Vote2Cap-DETR 摘要 3D密集描述要求模型将对输入3D场景的理解转化为与不同对象区域相关的几个标题。现有方法采用复杂的“检测-然后-描述”流程，该流程在具有许多手工制作组件的3D检测器上构建显式关系模块。虽然这些方法已经取得了初步成功，但由于复制的框估计和混乱的3D场景，级联流程往往会累积错误。在本文中，我们首先提出了Vote2Cap-DETR，这是一个简单而有 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博