ADriver-I：旷视科技打造的自动驾驶通用世界模型

智猩猩Auto · 公众号 · · 2024-09-22 19:02

文章预览

ADriver-I: A General World Model for Autonomous Driving 论文： https://arxiv.org/abs/2311.13549 ADriver-I 是由旷视科技联合早稻田大学和中科大共同研发的自动驾驶通用世界模型。这一模型创新性地结合了多模态大型语言模型（MLLM）和扩散模型，通过处理视觉-动作对，能够自回归地预测当前帧的控制信号，并基于此预测未来帧的场景。 ADriver-I 的设计理念是模仿人类驾驶员的行为，即直接根据视觉信息采取行动，并预测近期未来，而不是依赖传统的序列化处理流程。ADriver-I 的特点在于其能够实现自我生成的无限驾驶场景。通过不断迭代预测当前控制信号和未来帧，该模型能够在自身创建的环境中实现自动驾驶。这种自我生成和预测的能力，使得ADriver-I在自动驾驶领域展现出了巨大的潜力和应用前景。 ADriver-I在nuScenes和大规模私有数据集上进行了广泛的实验，相较于 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博