文章预览
ADAS Laboratory 点击上方 蓝字 关注 智驾实验室 加入【 智驾实验室 】交流群, 获取更多内容和资料 世界模型因其在预测潜在未来情景方面的能力而在自动驾驶领域受到越来越多的关注。在本文中,作者提出了_BEVWorld_,一种新颖的方法,将多模态传感器输入标记化为统一且紧凑的鸟瞰图(BEV)潜在空间进行环境建模。 世界模型由两部分组成:多模态标记器与潜在BEV序列扩散模型。多模态标记器首先编码多模态信息,解码器能够通过自监督的射线投射渲染将潜在BEV标记重建为激光雷达和图像观测。 然后,潜在BEV序列扩散模型在给定动作标记的条件下预测未来情景。实验证明了_BEVWorld_在自动驾驶任务中的有效性,展示了其在生成未来场景方面的能力,并有利于下游任务,如感知和运动预测。 代码将可在https://github.com/zympsyche/BevWorld获取。
………………………………