文章预览
Abstract 在自动驾驶的背景下,基于学习的方法在规划模块的开发中表现出了很大的潜力。在规划模块的训练过程中,直接最小化专家驾驶日志与规划输出之间的差异是一种广泛采用的策略。一般来说,驾驶日志包含突如其来的障碍物或迅速变化的交通信号,这些通常需要驾驶行为的快速且细微的调整。同时,车辆的未来轨迹展示了其长期决策,例如遵循参考车道或绕过静止障碍物。由于驾驶日志中未来事件的不可预测性,基于学习的规划模块中可能会引入推理偏差,从而导致驾驶性能的下降。为了解决这个问题,我们识别出决策及其对应的时间范围,并通过仅保留可推导范围内的决策来定义所谓的决策范围,以减轻由不可预测事件引起的不合理行为的影响。该框架使用基于小波变换的日志预处理,并采用有效的损失计算方法,使得规划模型仅对当
………………………………