专栏名称: 智驾实验室
欢迎关注“智驾实验室”!本公众号专注于自动驾驶领域,为您带来世界模型的最新研究,多模态大模型的深入解析,以及多模态大模型在自动驾驶领域的应用与落地。在这里,您可以了解到自动驾驶技术的最新动态,洞察行业趋势,与我们一起探索未来出行的无限可能。
今天看啥  ›  专栏  ›  智驾实验室

多所高校联合提出 Delphi | 基于扩散模型的长视频生成方法,用于提升端到端自动驾驶模型的规划性能 !

智驾实验室  · 公众号  ·  · 2024-06-18 17:16
    

文章预览

ADAS  Laboratory 点击上方 蓝字 关注  智驾实验室 加入【 智驾实验室 】交流群, 获取更多内容和资料 使用生成模型来合成新数据已经成为自动驾驶领域中解决数据稀缺问题的实际标准。尽管现有方法能够提升感知模型的性能,但作者发现这些方法未能改善端到端自动驾驶模型在规划方面的性能,因为生成的视频通常不足8帧,且空间和时间上的不一致性不容忽视。 为此,作者提出了 Delphi ,一种基于扩散的新型长视频生成方法,该方法通过跨多视图的共享噪声建模机制来增加空间一致性,并通过特征对齐模块实现精确可控性和时间一致性。 作者的方法可以生成高达40帧的视频而不损失一致性,这比现有最先进的方法长约5倍。作者并非随机生成新数据,而是进一步设计了一个采样策略,让 Delphi 生成与失败案例相似的新数据以提高样本效率。 这是通 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览