专栏名称: 自动驾驶之心
自动驾驶开发者社区,关注计算机视觉、多维感知融合、部署落地、定位规控、领域方案等,坚持为领域输出最前沿的技术方向!
今天看啥  ›  专栏  ›  自动驾驶之心

清华大学提出DRIVESCaPE:迈向可旋转多视角驾驶视频生成 !

自动驾驶之心  · 公众号  ·  · 2024-11-04 07:30
    

文章预览

作者 | AI 驾驶员  编辑 | 智驾实验室 点击下方 卡片 ,关注“ 自动驾驶之心 ”公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >> 点击进入→ 自动驾驶之心 『 世界模型 』 技术交流群 本文只做学术分享,如有侵权,联系删文 近年来生成模型的进步为合成逼真的驾驶视频提供了有前景的解决方案,这对训练自动驾驶感知模型至关重要。 然而,现有的方法往往在集成3D信息时遇到困难,同时保持空间-时间一致性并从统一的模型中有效学习,这使得多视视频生成往往受限于每帧2HZ的3D框标注帧率,而作者的DriveScape却能克服这一限制,以稀缺条件下的精确运行能力,实现1024x576的高分辨率视频以10Hz的速度生成。 与其他方法相比,由于作者的双向调制 Transformer (BiMot)可以确保3D结构信息的精确对齐,保持空间-时间一致性。 在与nuScenes数据集的对 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览