今天看啥  ›  专栏  ›  灵度智能

MambaDETR: 基于查询的时间建模,使用状态空间模型进行多视图 3D 对象检测 !

灵度智能  · 公众号  ·  · 2024-12-27 12:10
    

文章预览

点击下方卡片,关注 「AI视界引擎」 公众号 ( 添加时备注:方向+学校/公司+昵称/姓名 ) 利用时间信息提高3D检测在自动驾驶领域最近取得了巨大进步。 传统的基于 Transformer 的时空融合方法随着帧序列长度的增加,计算成本呈平方增长,且信息衰减。 在本文中,作者提出了一种新颖的方法MambaDETR,其主要思想是将时空融合实现于高效状态空间。此外,作者还设计了一个运动消除模块,用于移除相对静止的目标进行时空融合。 在标准的nuScenes基准测试中,作者提出的MambaDETR在3D目标检测任务上取得了显著的结果,在现有时 空融合方法中展现出最先进的性能。 1 Introduction 多视图3D目标检测是自动驾驶领域的一个基本任务,它使车辆能够利用传感器数据感知周围环境。最近的研究利用图像帧序列的时间信息来提高检测性能。具有注意力机制的Transformer在 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览