主要观点总结
本文介绍了全球自动驾驶峰会、智能驾驶的快速发展以及视觉语言动作(VLA)模型的相关信息。峰会将在北京举办,包含多个分会场和技术研讨会。智能驾驶方面,国内竞争非常激烈,技术发展迅速。文章详细解释了VLA模型的概念、优点、实验室进展、落地应用的挑战、车企的布局以及VLA是否是自动驾驶的最终归宿等问题。
关键观点总结
关键观点1: 全球自动驾驶峰会
峰会将于1月14日在北京举办,包含主会场开幕式、端到端自动驾驶创新论坛,以及分会场的专题论坛和技术研讨会。
关键观点2: 智能驾驶的快速发展
智能驾驶在国内的落地发展非常迅速,从体验功能端到硬核的软件技术端,竞争非常激烈。
关键观点3: VLA模型介绍
VLA模型是视觉语言动作模型的简称,是一种基于视觉和语言处理结合的技术,可以解释复杂的指令并在物理世界中执行动作。
关键观点4: VLA模型的优点
VLA模型具有端到端大模型的优点,如通用性,可解释性,大数据量处理能力等。它使得所有智能机械设备都可以采用这套大模型算法,通过微调实现各种功能。
关键观点5: 实验室中的VLA进展
目前谷歌DeepMind推出了全球首个用于控制机器人的视觉语言动作(VLA)模型RT-2,以及OpenVLA模型等,这些模型的推出激励了智能机器人行业的发展。
关键观点6: 落地应用VLA的挑战
VLA模型在实际应用中面临着计算成本高、缺乏有效数据集、训练匹配语言描述和驾驶行为或机器人动作等挑战。
关键观点7: 车企的布局
目前已有一些车企在布局VLA模型的应用,如理想、Wayve等。华为也在急攻一段式端到端技术,预计其应用VLA的时间不会太长。
关键观点8: VLA是否是自动驾驶的最终归宿
目前还很难说,因为AI的发展非常迅猛,从LLM到VLM再到未来的Spatial人工智能都有可能。但是自动驾驶采用AI的大方向是既定的。
文章预览
大会预告 1月14日,第四届全球自动驾驶峰会 将在北京举办。峰会主会场将进行开幕式、端到端自动驾驶创新论坛,分会场将进行城市NOA专题论坛,和自动驾驶视觉语言模型、自动驾驶世界模型两场技术研讨会。目前,中科院自动化所副研究员张启超,北汽研究总院智能网联中心专业总师林大洋,昇启科技创始人孙琪,百度Apollo开放平台首席架构师胡旷,朗歌科技副总经理、智驾地图事业部总经理李战斌已确认参会并将带来主题分享。 太卷了,智能驾驶在国内的落地发展太迅速了,从体验功能端,大家开城大战打完了之后就进入点到点的落地战,点到点弄完了之后肯定Robotaxi大战;而在硬核的软件技术端,端到端大模型战在华为这个月宣布急攻端到端大模型的信息下,已经算是进入焦灼状态。 那么端到端大模型之后呢? 或许最近不少苗头已经透露
………………………………