文章预览
作者 | 小研 编辑 | 计算机书童 点击下方 卡片 ,关注“ 3D视觉之心 ”公众号 第一时间获取 3D视觉干货 >> 点击进入→ 3D视觉之心技术交流群 题目:Vote2Cap-DETR++: Decoupling Localization and Describing for End-to-End 3D Dense Captioning Vote2Cap-DETR++:解耦定位与描述的端到端3D密集描述 作者:Sijin Chen; Hongyuan Zhu; Mingsheng Li; Xin Chen; Peng Guo; Yinjie Lei; Gang Yu; Taihao Li; Tao Chen 源码链接:https://github.com/ch3cook-fdu/Vote2Cap-DETR 摘要 3D密集描述要求模型将对输入3D场景的理解转化为与不同对象区域相关的几个标题。现有方法采用复杂的“检测-然后-描述”流程,该流程在具有许多手工制作组件的3D检测器上构建显式关系模块。虽然这些方法已经取得了初步成功,但由于复制的框估计和混乱的3D场景,级联流程往往会累积错误。在本文中,我们首先提出了Vote2Cap-DETR,这是一个简单而有
………………………………