文章预览
点击下方 卡片 ,关注“ 自动驾驶之星 ” 这里有一群奋斗在自动驾驶 & 座舱量产第一线的小伙伴等你加入 随着VLM大模型在自动驾驶中逐渐崭露头角,今天给大家整理一下近期关注的一些VLM相关的论文供大家交流讨论! 《DRIVEVLM: The Convergence of Autonomous Driving and Large Vision-Language Models 》---理想 & 清华 摘要与关键词 摘要中提到了自动驾驶在城市环境中理解复杂场景的挑战,并介绍了DriveVLM系统,该系统利用视觉-语言模型(VLMs)提升场景理解和规划能力。 关键词包括:自动驾驶、视觉语言模型、双系统。 系统介绍 DriveVLM :一个新颖的自动驾驶系统,专注于场景理解挑战,结合了视觉理解和推理能力。 DriveVLM-Dual :一个混合系统,结合了DriveVLM与传统自动驾驶流程的优势,以改善空间推理和实时规划能力。 研究动机 自动驾驶的主要挑战之一是场景理
………………………………