注册
登录
专栏名称:
智驾实验室
欢迎关注“智驾实验室”!本公众号专注于自动驾驶领域,为您带来世界模型的最新研究,多模态大模型的深入解析,以及多模态大模型在自动驾驶领域的应用与落地。在这里,您可以了解到自动驾驶技术的最新动态,洞察行业趋势,与我们一起探索未来出行的无限可能。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
中国基金报
·
雷军,发声!
·
21 小时前
中科院物理所
·
羊的物理学——从相变到集体运动
·
2 天前
中国基金报
·
A股又有重大资产重组
·
2 天前
中国基金报
·
收官了,最后一跌
·
3 天前
中国基金报
·
又一银行港股IPO
·
3 天前
今天看啥
›
专栏
›
智驾实验室
清华大学、东北大学提出 DRIVESCaPE: 迈向高分辨率可旋转多视角驾驶视频生成 !
智驾实验室
·
公众号
· · 2024-10-30 08:00
文章预览
ADAS Laboratory 点击上方 蓝字 关注 智驾实验室 加入【 智驾实验室 】交流群, 获取更多内容和资料 近年来生成模型的进步为合成逼真的驾驶视频提供了有前景的解决方案,这对训练自动驾驶感知模型至关重要。 然而,现有的方法往往在集成3D信息时遇到困难,同时保持空间-时间一致性并从统一的模型中有效学习,这使得多视视频生成往往受限于每帧2HZ的3D框标注帧率,而作者的DriveScape却能克服这一限制,以稀缺条件下的精确运行能力,实现1024x576的高分辨率视频以10Hz的速度生成。 与其他方法相比,由于作者的双向调制 Transformer (BiMot)可以确保3D结构信息的精确对齐,保持空间-时间一致性。 在与nuScenes数据集的对比中,DriveScape在生成性能方面表现出色,实现了最先进的结果,FID得分为8.34,FVD得分为76.39。代码将在作者的项目主页上 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
中国基金报
·
雷军,发声!
21 小时前
中科院物理所
·
羊的物理学——从相变到集体运动
2 天前
中国基金报
·
A股又有重大资产重组
2 天前
中国基金报
·
收官了,最后一跌
3 天前
中国基金报
·
又一银行港股IPO
3 天前
初善投资
·
重磅!临时说一个确定性吃肉机会!
5 月前
铅笔道
·
苏州杀出超级IPO:年入9.28亿,全国第三
3 月前