2025年，自动驾驶即将开卷端到端大模型2.0 - VLA

智猩猩Auto · 公众号 · 科技自媒体 · 2024-12-23 11:56

主要观点总结

本文介绍了全球自动驾驶峰会、智能驾驶的快速发展以及视觉语言动作（VLA）模型的相关信息。峰会将在北京举办，包含多个分会场和技术研讨会。智能驾驶方面，国内竞争非常激烈，技术发展迅速。文章详细解释了VLA模型的概念、优点、实验室进展、落地应用的挑战、车企的布局以及VLA是否是自动驾驶的最终归宿等问题。

关键观点总结

关键观点1: 全球自动驾驶峰会

峰会将于1月14日在北京举办，包含主会场开幕式、端到端自动驾驶创新论坛，以及分会场的专题论坛和技术研讨会。

关键观点2: 智能驾驶的快速发展

智能驾驶在国内的落地发展非常迅速，从体验功能端到硬核的软件技术端，竞争非常激烈。

关键观点3: VLA模型介绍

VLA模型是视觉语言动作模型的简称，是一种基于视觉和语言处理结合的技术，可以解释复杂的指令并在物理世界中执行动作。

关键观点4: VLA模型的优点

VLA模型具有端到端大模型的优点，如通用性，可解释性，大数据量处理能力等。它使得所有智能机械设备都可以采用这套大模型算法，通过微调实现各种功能。

关键观点5: 实验室中的VLA进展

目前谷歌DeepMind推出了全球首个用于控制机器人的视觉语言动作（VLA）模型RT-2，以及OpenVLA模型等，这些模型的推出激励了智能机器人行业的发展。

关键观点6: 落地应用VLA的挑战

VLA模型在实际应用中面临着计算成本高、缺乏有效数据集、训练匹配语言描述和驾驶行为或机器人动作等挑战。

关键观点7: 车企的布局

目前已有一些车企在布局VLA模型的应用，如理想、Wayve等。华为也在急攻一段式端到端技术，预计其应用VLA的时间不会太长。

关键观点8: VLA是否是自动驾驶的最终归宿

目前还很难说，因为AI的发展非常迅猛，从LLM到VLM再到未来的Spatial人工智能都有可能。但是自动驾驶采用AI的大方向是既定的。

文章预览

大会预告 1月14日，第四届全球自动驾驶峰会将在北京举办。峰会主会场将进行开幕式、端到端自动驾驶创新论坛，分会场将进行城市NOA专题论坛，和自动驾驶视觉语言模型、自动驾驶世界模型两场技术研讨会。目前，中科院自动化所副研究员张启超，北汽研究总院智能网联中心专业总师林大洋，昇启科技创始人孙琪，百度Apollo开放平台首席架构师胡旷，朗歌科技副总经理、智驾地图事业部总经理李战斌已确认参会并将带来主题分享。太卷了，智能驾驶在国内的落地发展太迅速了，从体验功能端，大家开城大战打完了之后就进入点到点的落地战，点到点弄完了之后肯定Robotaxi大战；而在硬核的软件技术端，端到端大模型战在华为这个月宣布急攻端到端大模型的信息下，已经算是进入焦灼状态。那么端到端大模型之后呢？或许最近不少苗头已经透露 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博