专栏名称: 智猩猩Auto
聚焦智能汽车关键技术与创新产品
今天看啥  ›  专栏  ›  智猩猩Auto

端到端训练新范式!华科&地平线RAD:基于3DGS的闭环强化学习SOTA!性能提升3倍~

智猩猩Auto  · 公众号  ·  · 2025-02-21 22:08
    

文章预览

直播预告 智猩猩「DeepSeek大解读 」系列公开课第三期来啦!2月24日19:00 ,阿里云三位技术专家将分别围绕云上智能算力支撑DeepSeek、智算场景的Kubernetes容器、DeepSeek一键部署及应用集成进行直播讲解。扫码报名申请观看直播或入群交流。 文章转载自公众号: 自动驾驶之心。 本文只做学术/技术分享,如有侵权,联系删文。 现有的端到端自动驾驶(AD)算法通常遵循模仿学习(IL)范式,这面临着因果混淆和开环Gap等 挑战。在这项工作中,我们建立了一个基于3DGS的闭环强化学习(RL)训练范式。通过利用3DGS技术,可以构建真实物理世界的真实仿真结果,使AD策略能够广泛探索状态空间,并通过大规模试错学习处理分布外场景。为了提高安全性,我们设计了专门的奖励机制,引导策略有效应对安全关键事件并理解现实世界的因果关系。为了更好地与人 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览