今天看啥  ›  专栏  ›  3D视觉之心

TPAMI 2024 | Vote2Cap-DETR++:解耦定位与描述的端到端3D密集描述

3D视觉之心  · 公众号  ·  · 2024-11-02 07:00
    

文章预览

作者 | 小研  编辑 | 计算机书童 点击下方 卡片 ,关注“ 3D视觉之心 ”公众号 第一时间获取 3D视觉干货 >> 点击进入→ 3D视觉之心技术交流群 题目:Vote2Cap-DETR++: Decoupling Localization and Describing for End-to-End 3D Dense Captioning Vote2Cap-DETR++:解耦定位与描述的端到端3D密集描述 作者:Sijin Chen; Hongyuan Zhu; Mingsheng Li; Xin Chen; Peng Guo; Yinjie Lei; Gang Yu; Taihao Li; Tao Chen 源码链接:https://github.com/ch3cook-fdu/Vote2Cap-DETR 摘要 3D密集描述要求模型将对输入3D场景的理解转化为与不同对象区域相关的几个标题。现有方法采用复杂的“检测-然后-描述”流程,该流程在具有许多手工制作组件的3D检测器上构建显式关系模块。虽然这些方法已经取得了初步成功,但由于复制的框估计和混乱的3D场景,级联流程往往会累积错误。在本文中,我们首先提出了Vote2Cap-DETR,这是一个简单而有 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览