专栏名称: Ai fighting

本公众号主要分享自动驾驶感知实战，从算法训练到模型部署。主要致力于3D目标检测，3D目标追踪，多传感器融合，Transform，BEV，OCC，模型量化，模型部署等方向的实战。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

LAM3D 框架：利用视觉 Transformer 实现高效的单目3D目标检测！

Ai fighting · 公众号 · · 2024-09-02 22:48

文章预览

自从引入自注意力机制和采用Transformer架构在计算机视觉任务中，基于视觉Transformer（ViT）架构的体系结构在许多领域变得非常受欢迎，被用于图像分类、目标检测和图像分割等任务。然而，在视觉Transformer（ViT）中有效利用注意力机制在单目3D目标检测任务中仍然是一个开放的问题。在这篇论文中，作者提出了LAM3D框架，该框架利用自注意力机制进行单目3D目标检测。为此，所提出的方法建立在了一个Pyramid Vision Transformer v2（PVTv2）作为特征提取背心和2D/3D检测工具上。作者在KITTI 3D目标检测基准测试上评估所提出的算法，证明所提出的解决方案在自动驾驶领域适用，并超过了参考方法。此外，由于使用自注意力机制，LAM3D能够系统性地优于不使用自注意力的等效架构。 I Introduction 目标检测是计算机视觉中的一个基本任务，它涉及到在图像或视频中 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博