文章预览
点击下方 卡片 ,关注“ 自动驾驶专栏 ”公众号 自动驾驶干货 ,即可获取 论文链接: https://arxiv.org/pdf/2408.09122 摘要 本文介绍了MaskBEV:面向BEV检测和地图分割的统一框架 。准确且鲁棒的多模态多任务感知对于现代自动驾驶系统是至关重要的。然而,目前多模态感知研究遵循为特定感知任务设计的独立范式,导致任务之间缺乏互补学习,并且由于联合训练造成多任务学习(MTL)的性能降低。本文提出了MaskBEV,这是一种基于掩码注意力的MTL范式,其统一了3D目标检测和鸟瞰图(BEV)分割。MaskBEV引入了任务无关的Transformer解码器来处理这些不同的任务,使MTL能够在统一的解码器中完成,而不需要额外设计特定的任务头。为了充分利用BEV分割和BEV空间中3D目标检测任务之间的互补信息,本文提出了空间调制和场景级上下文聚合策略。这些策略考虑了BEV分
………………………………