专栏名称: 智驾最前沿
「智驾最前沿」深耕自动驾驶领域技术、资讯等信息,解读行业现状、紧盯行业发展、挖掘行业前沿,致力于助力自动驾驶发展与落地!
目录
相关文章推荐
今天看啥  ›  专栏  ›  智驾最前沿

一文读懂自动驾驶多目视觉感知

智驾最前沿  · 公众号  ·  · 2024-09-21 08:40
    

主要观点总结

本文主要介绍了基于视觉传感器的感知方法,包括2D感知和3D感知,以及从深度学习在视觉感知中的应用。文章还详细描述了多目视觉系统的原理和难点,以及几个典型的多目系统。最后,文章以Tesla的全景感知系统为例,介绍了基于多目的全景感知系统的技术特点和实现方法。

关键观点总结

关键观点1: 视觉感知系统的分类和特点

视觉感知系统分为单目系统、双目系统、多目系统。2D感知任务通常采用的是单目系统,但自动驾驶感知最终需要的是3D输出。双目系统可以自然的获得视差,估计障碍物的距离,但对模式识别的依赖度较小,且存在某些缺点如关键点获取困难、计算量大等。

关键观点2: 多目系统的原理和难点

多目系统通过增加不同类别的传感器,如红外摄像头,来提高对各种环境条件的适应性。通过增加不同朝向、不同焦距的摄像头来扩展系统的视野范围。难点在于如何处理重叠区域中不一致的感知结果,以及设计合理的融合规则。

关键观点3: 典型的多目系统介绍

文章介绍了Mobileye的三目系统、Foresight的四目感知系统、NODAR的Hammerhead技术等典型的多目系统。

关键观点4: Tesla的全景感知系统

Tesla在AI Day上展示了纯视觉的FSD系统,采用多摄像头融合方案。其核心技术包括特征的空间变换、向量空间中的标注等。通过Transformer和Self-Attention等方式建立图像空间到向量空间的对应关系,解决特征的空间变换问题。通过3D场景下的标注、自动标注和模拟器等技术组合,构成完整的数据收集和标注系统。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照