专栏名称: 计算机视觉之路
今天看啥  ›  专栏  ›  计算机视觉之路

【GPD-1: 自动驾驶场景的演变建模,包括地图生成、运动预测和轨迹规划等任务】

计算机视觉之路  · 公众号  ·  · 2024-12-18 12:57
    

文章预览

GPD-1(Generative Pre-training for Driving)是一个统一的模型,用于自动驾驶场景的演变建模,包括地图生成、运动预测和轨迹规划等任务,而无需额外的微调。以下是GPD-1模型的主要方法和特点: 1. 统一的标记表示:GPD-1将每个场景表示为自我(ego)、代理(agent)和地图(map)标记,并把自动驾驶问题表述为统一的标记生成问题。 2. 自回归变换器架构:GPD-1采用自回归变换器(autoregressive transformer)架构,并使用场景级注意力掩码(scene-level attention mask)来实现场景内双向交互。 3. 层次位置分词器:对于自我和代理标记,GPD-1提出了一个层次位置分词器,有效地编码二维位置和方向。 4. 地图矢量量化自编码器:对于地图标记,GPD-1训练了一个地图矢量量化自编码器(map vector-quantized autoencoder),将自我中心的语义地图高效压缩成离散标记。 5. 两阶段 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览