专栏名称: 计算机视觉工坊

专注于计算机视觉、VSLAM、目标检测、语义分割、自动驾驶、深度学习、AI芯片、产品落地等技术干货及前沿paper分享。这是一个由多个大厂算法研究人员和知名高校博士创立的平台，我们坚持工坊精神，做最有价值的事~

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

Transformer撑起了自动驾驶的半边天！

计算机视觉工坊 · 公众号 · · 2024-04-02 11:00

文章预览

说到纯视觉的自动驾驶方案，大家第一个想到的就是Tesla吧。的确，早在2021年，Tesla就已经实现了纯视觉的BEV检测方案，而且效果非常好。细心的同学可能发现了，这套BEV方案中将相机空间的图像转换到BEV空间的核心组件就是 Transformer 。 Transformer来源于自然语言处理领域，首先被应用于机器翻译。后来，大家发现它在计算机视觉领域效果也很不错，而且在各大排行榜上碾压CNN网络。目标检测领域中，视觉Transformer不仅可以实现2D检测、3D检测，还可以实现多模态检测，BEV视角下的检测，性能也非常出色。因此，掌握Transformer相关知识和工程基础成为了企业招聘算法工程师的一个技能要求点，也是简历上的一个很大的加分项。然而，想要掌握基于Transformer的目标检测算法，有以下 3个难点：理解Transformer背后的理论基础，比如自注意力机制（self-atten ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博