专栏名称: 智驾实验室
欢迎关注“智驾实验室”!本公众号专注于自动驾驶领域,为您带来世界模型的最新研究,多模态大模型的深入解析,以及多模态大模型在自动驾驶领域的应用与落地。在这里,您可以了解到自动驾驶技术的最新动态,洞察行业趋势,与我们一起探索未来出行的无限可能。
目录
相关文章推荐
中国基金报  ·  雷军,发声! ·  21 小时前  
中国基金报  ·  又一银行港股IPO ·  3 天前  
今天看啥  ›  专栏  ›  智驾实验室

清华大学、东北大学提出 DRIVESCaPE: 迈向高分辨率可旋转多视角驾驶视频生成 !

智驾实验室  · 公众号  ·  · 2024-10-30 08:00
    

文章预览

ADAS  Laboratory 点击上方 蓝字 关注  智驾实验室           加入【 智驾实验室 】交流群, 获取更多内容和资料 近年来生成模型的进步为合成逼真的驾驶视频提供了有前景的解决方案,这对训练自动驾驶感知模型至关重要。 然而,现有的方法往往在集成3D信息时遇到困难,同时保持空间-时间一致性并从统一的模型中有效学习,这使得多视视频生成往往受限于每帧2HZ的3D框标注帧率,而作者的DriveScape却能克服这一限制,以稀缺条件下的精确运行能力,实现1024x576的高分辨率视频以10Hz的速度生成。 与其他方法相比,由于作者的双向调制 Transformer (BiMot)可以确保3D结构信息的精确对齐,保持空间-时间一致性。 在与nuScenes数据集的对比中,DriveScape在生成性能方面表现出色,实现了最先进的结果,FID得分为8.34,FVD得分为76.39。代码将在作者的项目主页上 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览