专栏名称: Ai fighting
本公众号主要分享自动驾驶感知实战,从算法训练到模型部署。主要致力于3D目标检测,3D目标追踪,多传感器融合,Transform,BEV,OCC,模型量化,模型部署等方向的实战。
今天看啥  ›  专栏  ›  Ai fighting

LAM3D 框架:利用视觉 Transformer 实现高效的单目3D目标检测 !

Ai fighting  · 公众号  ·  · 2024-09-02 22:48
    

文章预览

自从引入自注意力机制和采用Transformer架构在计算机视觉任务中,基于视觉Transformer(ViT)架构的体系结构在许多领域变得非常受欢迎,被用于图像分类、目标检测和图像分割等任务。 然而,在视觉Transformer(ViT)中有效利用注意力机制在单目3D目标检测任务中仍然是一个开放的问题。在这篇论文中,作者提出了LAM3D框架,该框架利用自注意力机制进行单目3D目标检测。 为此,所提出的方法建立在了一个Pyramid Vision Transformer v2(PVTv2)作为特征提取背心和2D/3D检测工具上。作者在KITTI 3D目标检测基准测试上评估所提出的算法,证明所提出的解决方案在自动驾驶领域适用,并超过了参考方法。 此外,由于使用自注意力机制,LAM3D能够系统性地优于不使用自注意力的等效架构。 I Introduction 目标检测是计算机视觉中的一个基本任务,它涉及到在图像或视频中 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览