今天看啥  ›  专栏  ›  智猩猩Auto

2025年,自动驾驶即将开卷端到端大模型2.0 - VLA

智猩猩Auto  · 公众号  · 科技自媒体  · 2024-12-23 11:56
    

主要观点总结

本文介绍了全球自动驾驶峰会、智能驾驶的快速发展以及视觉语言动作(VLA)模型的相关信息。峰会将在北京举办,包含多个分会场和技术研讨会。智能驾驶方面,国内竞争非常激烈,技术发展迅速。文章详细解释了VLA模型的概念、优点、实验室进展、落地应用的挑战、车企的布局以及VLA是否是自动驾驶的最终归宿等问题。

关键观点总结

关键观点1: 全球自动驾驶峰会

峰会将于1月14日在北京举办,包含主会场开幕式、端到端自动驾驶创新论坛,以及分会场的专题论坛和技术研讨会。

关键观点2: 智能驾驶的快速发展

智能驾驶在国内的落地发展非常迅速,从体验功能端到硬核的软件技术端,竞争非常激烈。

关键观点3: VLA模型介绍

VLA模型是视觉语言动作模型的简称,是一种基于视觉和语言处理结合的技术,可以解释复杂的指令并在物理世界中执行动作。

关键观点4: VLA模型的优点

VLA模型具有端到端大模型的优点,如通用性,可解释性,大数据量处理能力等。它使得所有智能机械设备都可以采用这套大模型算法,通过微调实现各种功能。

关键观点5: 实验室中的VLA进展

目前谷歌DeepMind推出了全球首个用于控制机器人的视觉语言动作(VLA)模型RT-2,以及OpenVLA模型等,这些模型的推出激励了智能机器人行业的发展。

关键观点6: 落地应用VLA的挑战

VLA模型在实际应用中面临着计算成本高、缺乏有效数据集、训练匹配语言描述和驾驶行为或机器人动作等挑战。

关键观点7: 车企的布局

目前已有一些车企在布局VLA模型的应用,如理想、Wayve等。华为也在急攻一段式端到端技术,预计其应用VLA的时间不会太长。

关键观点8: VLA是否是自动驾驶的最终归宿

目前还很难说,因为AI的发展非常迅猛,从LLM到VLM再到未来的Spatial人工智能都有可能。但是自动驾驶采用AI的大方向是既定的。


文章预览

大会预告 1月14日,第四届全球自动驾驶峰会 将在北京举办。峰会主会场将进行开幕式、端到端自动驾驶创新论坛,分会场将进行城市NOA专题论坛,和自动驾驶视觉语言模型、自动驾驶世界模型两场技术研讨会。目前,中科院自动化所副研究员张启超,北汽研究总院智能网联中心专业总师林大洋,昇启科技创始人孙琪,百度Apollo开放平台首席架构师胡旷,朗歌科技副总经理、智驾地图事业部总经理李战斌已确认参会并将带来主题分享。 太卷了,智能驾驶在国内的落地发展太迅速了,从体验功能端,大家开城大战打完了之后就进入点到点的落地战,点到点弄完了之后肯定Robotaxi大战;而在硬核的软件技术端,端到端大模型战在华为这个月宣布急攻端到端大模型的信息下,已经算是进入焦灼状态。 那么端到端大模型之后呢? 或许最近不少苗头已经透露 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览