今天看啥  ›  专栏  ›  自动驾驶Daily

端到端训练新范式!华科&地平线RAD:基于3DGS的闭环强化学习SOTA!性能提升3倍~

自动驾驶Daily  · 公众号  ·  · 2025-02-22 00:00
    

文章预览

点击下方 卡片 ,关注“ 自动驾驶之心 ”公众号 戳我->  领取 自动驾驶近15个 方向 学习 路线 今天自动驾驶之心为大家分享 华科 & 地平线最新的工作—RAD! 基于3DGS的闭环强化学习训练新范式,端到端碰撞率降低3倍! 如果您有相关工作需要分享,请在文末联系我们! 自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询 写在前面 & 笔者的个人理解 现有的端到端自动驾驶(AD)算法通常遵循模仿学习(IL)范式,这面临着因果混淆和开环Gap等挑战。在这项工作中,我们建立了一个基于3DGS的闭环强化学习(RL)训练范式。通过利用3DGS技术,可以构建真实物理世界的真实仿真结果,使AD策略能够广泛探索状态空间,并通过大规模试错学习处理分布外场景。为了提高安全性,我们设计了专门的奖励机制,引导策略有效应对 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览