文章预览
自动驾驶之星 点击上方 蓝字 关注 自动驾驶之星 点击下方 卡片 ,关注“ 自动驾驶之星 ” 这里有一群奋斗在自动驾驶量产第一线的小伙伴等你加入 作者提出DOME,这是一个基于扩散的智能世界模型,可以预测未来占用帧,基于过去的占用观测。该世界模型捕捉环境演化的能力对于自动驾驶规划至关重要。 与基于2D视频的世界模型相比,占用世界模型使用本地的3D表示,具有容易获取的标注,并且与模态无关。这种灵活性有可能促进更高级的世界模型的发展。现有的占用世界模型要么由于离散 Token 导致的细节损失,要么依赖于简单的扩散架构,导致预测未来占用具有可控性的效率低下和困难。 作者的DOME有两个关键特征: (1) 高保真度和长时间生成 。作者采用空间-时间扩散 Transformer 来基于历史上下文预测未来的占用帧。这种架构有效地捕获空
………………………………