【GPD-1: 自动驾驶场景的演变建模，包括地图生成、运动预测和轨迹规划等任务】

计算机视觉之路 · 公众号 · · 2024-12-18 12:57

文章预览

GPD-1（Generative Pre-training for Driving）是一个统一的模型，用于自动驾驶场景的演变建模，包括地图生成、运动预测和轨迹规划等任务，而无需额外的微调。以下是GPD-1模型的主要方法和特点： 1. 统一的标记表示：GPD-1将每个场景表示为自我（ego）、代理（agent）和地图（map）标记，并把自动驾驶问题表述为统一的标记生成问题。 2. 自回归变换器架构：GPD-1采用自回归变换器（autoregressive transformer）架构，并使用场景级注意力掩码（scene-level attention mask）来实现场景内双向交互。 3. 层次位置分词器：对于自我和代理标记，GPD-1提出了一个层次位置分词器，有效地编码二维位置和方向。 4. 地图矢量量化自编码器：对于地图标记，GPD-1训练了一个地图矢量量化自编码器（map vector-quantized autoencoder），将自我中心的语义地图高效压缩成离散标记。 5. 两阶段 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

疯子与书 · 诗歌的材料，不是观念，而是词语、意象与感觉。诗歌语言本身就是一种-20250224231210

14 小时前

疯子与书 · 弗洛伊德：人们爱他们的妄想，就像爱他们自己。-20250224204020

16 小时前

机器学习研究组订阅 · 再见，Devin！基于GPT-4o，最强「AI工程师」Genie诞生

6 月前

高分子科学前沿 · 南京大学甄叙、蒋锡群团队《CSR》：激光/X-射线/超声激活有机分子探针的延迟光子发射用于生物成像：机理、分子设计策略、成像应用

4 月前

半导体行业观察 · 台积电美国厂，良率大突破

4 月前

深圳晚报 · 深圳地铁这3个站点部分出入口临时关闭！

1 月前