专栏名称: 自动驾驶专栏
自动驾驶专栏,持续聚焦自动驾驶最新资讯,并且分享行业内相关技术研究。欢迎志同道合的伙伴关注,并参与交流或者分享。
今天看啥  ›  专栏  ›  自动驾驶专栏

【Waymo】自动驾驶中利用强化学习微调来改进智能体行为

自动驾驶专栏  · 公众号  ·  · 2024-10-19 09:10

文章预览

点击下方 卡片 ,关注“ 自动驾驶专栏 ”公众号 自动驾驶干货 ,即可获取 论文链接: https://arxiv.org/pdf/2409.18343 摘要 本文介绍了自动驾驶中利用强化学习微调来改进智能体行为。自动驾驶汽车研究的一个主要挑战是对智能体行为进行建模,这具有关键的应用,包括为非车载评估构建逼真且可靠的仿真以及为车载规划预测交通智能体运动。尽管监督学习已经在跨不同领域建模智能体方面取得了成功,但是这些模型在测试部署时可能会受到分布偏移的影响。本项工作通过使用强化学习对行为模型进行闭环微调来提高智能体行为的可靠性。本文方法在Waymo Open Sim Agents挑战赛中展现了整体性能的提高以及碰撞率等目标指标的改进。此外,本文还提出了一种新的策略评估基准,以直接评估仿真智能体衡量自动驾驶汽车规划器质量的能力,并且证明了本文方 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览