文章预览
Title: OccWorld: Learning a 3D Occupancy World Model for Autonomous Driving github: https://github.com/wzzheng/OccWorld 发表单位: 清华大学 Abstract 在本文中,我们探索了在3D空间中学习 world model 的新框架 OccWorld ,以同时预测自车运动和周围场景的演变。 我们建议基于 3D occupancy 而非3D框和分割地图来学习世界模型,原因有三: 表现力。3D occupancy 可以描述场景更精细的 3D 结构 ; 效率。3D occupancy 的获取更经济(例如,从稀疏的激光雷达点获取)。 通用性。3D occupancy 可以同时适应视觉和激光雷达。 为了便于 world evolution 建模,我们在 3D occupancy 上学习基于重构的 scene tokenizer,以获得离散的场景 tokens 来描述周围的场景。然后,我们采用类似于GPT 的 spatial-temporal generative transformer 来生成后续的场景和自车 tokens,以解码未来的占用和自车轨迹。在 nuScenes 基准上进行的大量实验证
………………………………