文章预览
👀 导读 理想汽车智驾团队联合西湖大学等提出了一种新的基于扩散模型的可控长视频生成的方法--Delphi,来释放 端到端模型 的泛化性能。该方法可以在公开的nuScenes数据集上生成长达 40 帧的具备 时空一致性 的长视频,该时长大约是目前最优方法可生成时长的 5 倍。以Delphi为数据引擎,该文进一步地提出了一个 failure-case driven framework,该框架能有效地提升数据采样的效率,从而用最小的数据成本提升端到端模型在复杂场景上的泛化性能。在大规模的nuSenes数据集上的实验表明,以Delphi为数据引擎的的failure-case driven framework, 仅需生成4% 的训练数据集大小,就能够将端到端自动驾驶模型的规划性能提高 25%。 论文信息 论文题目:Unleashing Generalization of End-to-End Autonomous Driving with Controllable Long Video Generation 论文发表单位:西湖大学,理想汽车,天津大学
………………………………