【Waymo】EMMA：自动驾驶中的端到端多模态模型

自动驾驶专栏 · 公众号 · · 2024-11-01 09:10

文章预览

点击下方卡片，关注“ 自动驾驶专栏 ”公众号自动驾驶干货，即可获取论文链接： https://arxiv.org/pdf/2410.23262 摘要本文介绍了EMMA：自动驾驶中的端到端多模态模型。EMMA建立在多模态大型语言模型的基础上，它将原始的相机传感器数据直接映射到各种驾驶特定的输出中，包括规划器轨迹、感知目标和道路图元素。EMMA通过将所有非传感器输入（例如导航指令和自车状态）和输出（例如轨迹和3D位置）表示为自然语言文本，最大限度地利用了来自预训练大型语言模型的世界知识。该方法允许EMMA在统一的语言空间中联合处理各种驾驶任务，并且使用任务特定的提示为每项任务生成输出结果。本文通过在nuScenes上实现最先进的运动规划性能以及在Waymo Open Motion Dataset（WOMD）上获得具有竞争力的结果来证明EMMA的有效性。EMMA还在Waymo Open Dataset（WOD）上的主 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

金华晚报 · 美股收盘：纳斯达克中国金龙指数收跌5.24%，阿里巴巴跌逾10%

2 天前

金华晚报 · 美股收盘：纳斯达克中国金龙指数收跌5.24%，阿里巴巴跌逾10%

2 天前

国聘 · 水利部所属单位2024年度第二批公开招聘工作人员公告

7 月前

南方周末 · 一座“睡城”与虹桥机场的噪音纠葛

6 月前

中国农业银行陕西省分行 · 农行陕西省分行受邀参加西北农林科技大学90周年校庆活动

5 月前