VLM-AD：通过视觉语言模型监督实现端到端自动驾驶

汽车未来科技Lab · 公众号 · · 2025-01-09 15:18

文章预览

点击蓝字关注我们今天给大家带来通用汽车旗下无人驾驶部门Cruise LLC最新的大模型论文。【论文标题】 VLM-AD: End-to-End Autonomous Driving through Vision-Language Model Supervision 【论文链接】https://arxiv.org/pdf/2412.14446v1 1 摘要人类驾驶员依靠常识推理来驾驭现实世界中的各种动态场景。现有的端到端（E2E）自动驾驶（AD）模型通常是为了模仿数据中观察到的驾驶模式而优化的，并没有捕捉到潜在的推理过程。这种局限性限制了它们处理具有挑战性的驾驶场景的能力。为了缩小这一差距提出了 VLM-AD 方法，该方法利用视觉语言模型（VLMs）作为教师，通过提供额外的监督（包含非结构化推理信息和结构化动作标签）来加强训练。这种监督增强了模型学习更丰富特征表征的能力，从而捕捉到驾驶模式背后的原理。重要的是，本文方法在推理过程中不需要 VLM，因 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

微观三农 · 多因素支撑年前玉米市场出现翘尾行情

昨天

CFC商品策略研究 · 【建投专题】结构性矛盾凸出，20号胶近月强升水

2 天前

微观三农 · 广西：让秸秆“包袱”变农民“财富”

2 天前

新闻夜航 · 确诊人数猛增好几倍！最小才5岁！

5 月前

志公教育 · 月薪5000元起！补贴+专科起报...百色市事业单位面向社会公开招聘人才

1 月前

彬彬有理 · 布局22年，400亿女首富，她最终想要的竟然是这？

1 月前