文章预览
Abstract 自动驾驶 (AD) 中的端到端架构面临着解释性问题,阻碍了人类对AI的信任。人性化的自然语言已被用于驾驶解释和三维场景描述等任务。然而,之前的工作主要集中在声明性可解释性的范式上,自然语言解释并未基于AD系统的中间输出,这使得解释仅仅是声明性的。相比之下,对齐式可解释性则在语言和AD系统的中间输出之间建立了联系。本文提出了Hint-AD,这是一种整合了AD和语言系统的架构,它生成的语言与AD模型的整体感知-预测-规划输出相一致。通过结合中间输出和有效特征适配的整体token混合子网络,Hint-AD在驾驶语言任务(如驾驶解释、三维密集描述和命令预测)中实现了令人满意的准确性,达到了最新的结果。为了促进在nuScenes上的驾驶解释任务研究,我们还引入了一个人工标注的数据集Nu-X。 代码及数据获取 :https://air-discover.github.
………………………………