专栏名称: 自动驾驶之星
自动驾驶之星,是一个以自动驾驶量产交流为主的社区。这里有自动驾驶量产第一线的前沿动态,有一群奋斗在自动驾驶量产第一线的小伙伴在分享他们的量产经历。期待你的加入!希望每个人在这个浪潮中都能成为自动驾驶之星!
今天看啥  ›  专栏  ›  自动驾驶之星

MaskFuser : 端到端自动驾驶联合多模态令牌的掩蔽融合,实现图像与激光雷达的深度融合 !

自动驾驶之星  · 公众号  ·  · 2024-08-17 09:58

文章预览

自动驾驶之星 点击上方 蓝字 关注 自动驾驶之星 点击下方 卡片 ,关注“ 自动驾驶之星 ” 这里有一群奋斗在自动驾驶 & 座舱量产第一线的小伙伴等你加入 当前的多模态驾驶框架通常通过在单模态分支之间使用注意力机制来融合表示。然而,现有的网络仍然抑制了驾驶性能,因为图像和激光雷达分支是独立的,缺乏统一的观察表示。 因此,本文提出了MaskFuser,它将各种模态标记化为统一的语义特征空间,并为在驾驶环境中的进一步行为克隆提供联合表示。在统一的标记表示下,MaskFuser是首次引入跨模态 Mask 自动编码器训练的工作。Mask 训练通过在 Mask 标记上的重建增强了融合表示。 在架构上,提出了一种混合融合网络,结合了早期融合和晚期融合的优势:在早期融合阶段,通过在分支之间执行单调到BEV翻译注意力来融合模态; 晚期融合是通过 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览