专栏名称: 智车科技
自动驾驶内容服务商。聚焦自动驾驶前沿动态,引领汽车行业科技创新!
今天看啥  ›  专栏  ›  智车科技

提升纯视觉端到端上限,4D Occ和运动规划最新SOTA!

智车科技  · 公众号  ·  · 2024-09-24 20:30
    

文章预览

本文来源 :自动驾驶之心(ID:whwx_runner) 写在前面 纯视觉端到端自动驾驶不仅比激光雷达与视觉融合的方法更具成本效益,而且比传统方法更可靠。 为了实现经济且鲁棒的纯视觉自动驾驶系统,这里提出了RenderWorld,一个仅基于视觉的端到端自动驾驶框架,它使用自监督的高斯-based Img2Occ模块生成3D占用标签,然后通过AM-VAE对标签进行编码,并利用世界模型进行预测和规划。RenderWorld采用高斯溅射(Gaussian Splatting)来表示3D场景,并渲染2D图像,与基于NeRF的方法相比,这大大提高了分割精度并降低了GPU内存消耗。通过将AM-VAE应用于分别编码空气和非空气部分,RenderWorld实现了更细粒度的场景元素表示,从而在基于自回归世界模型的4D占用预测和运动规划方面达到了最先进的性能。 行业背景介绍 随着自动驾驶技术的广泛应用,研究人员逐渐将重点放 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览