文章预览
点击下方 卡片 ,关注“ 自动驾驶专栏 ”公众号 自动驾驶干货 ,即可获取 论文链接: https://arxiv.org/pdf/2409.18341 代码链接:https://github.com/PeidongLi/SSR 摘要 端到端自动驾驶(E2EAD)方法通常依赖于监督感知任务来提取显式的场景信息(例如目标、地图)。这种依赖性需要代价高昂的标注,并且限制了实时应用中的部署和数据可扩展性。本文引入了SSR,这是一种仅使用16个导航引导的tokens作为稀疏场景表示的新框架,它为E2EAD高效地提取了关键场景信息。本文方法消除了对监督子任务的需求,允许计算资源集中在与导航意图直接相关的基本元素上。本文进一步引入了一种时间增强模块,它采用鸟瞰图(BEV)世界模型,通过自监督将预测的未来场景与实际的未来场景对齐。SSR在nuScenes数据集上实现了最先进的规划性能,相比于领先的E2EAD方法UniAD,L2误差
………………………………