专栏名称: 智车科技
自动驾驶内容服务商。聚焦自动驾驶前沿动态,引领汽车行业科技创新!
今天看啥  ›  专栏  ›  智车科技

STR2:结合了Vision Transformer (ViT) 编码器和混合专家(MoE) 的Transformer架构

智车科技  · 公众号  ·  · 2024-11-06 20:30
    

文章预览

本文来源: 自 动驾驶 之心( ID : whwx_runner ) 大型实际驾驶数据集推动了有关自动驾驶数据驱动运动规划器的各个方面的研究,包括数据增强、模型架构、奖励设计、训练策略和规划器架构。在处理复杂和少样本情况下,这些方法有较好的表现。但是由于设计过于复杂或训练范式的问题,这些方法在规划性能上的泛化能力有限。在本文中,我们回顾并比较了以前的方法,重点关注泛化能力。实验结果显示,随着模型的适当扩展,许多设计元素变得冗余。 我们介绍了StateTransformer-2 (STR2),这是一种可扩展的、仅使用解码器的运动规划器,它结合了Vision Transformer (ViT) 编码器和混合专家(MoE) 的Transformer架构。 MoE骨干通过训练期间的专家路由解决了模态崩溃和奖励平衡问题。在NuPlan数据集上的大量实验表明,我们的方法在不同测试集和闭环模拟中比以前 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览