专栏名称: 智猩猩Auto
聚焦智能汽车关键技术与创新产品
目录
相关文章推荐
经视直播  ·  刀郎,突然官宣! ·  2 天前  
经视直播  ·  情况通报! ·  2 天前  
今天看啥  ›  专栏  ›  智猩猩Auto

清华大学与NUS联合提出LaVida Drive:用于自动驾驶的视觉-文本交互VLM

智猩猩Auto  · 公众号  ·  · 2024-12-22 16:19
    

文章预览

大会预告 1月14日,第四届全球自动驾驶峰会 将在北京举办。峰会主会场将进行开幕式、端到端自动驾驶创新论坛,分会场将进行城市NOA专题论坛,和自动驾驶视觉语言模型、自动驾驶世界模型两场技术研讨会。目前,中科院自动化所副研究员张启超,北汽研究总院智能网联中心专业总师林大洋,昇启科技创始人孙琪,百度Apollo开放平台首席架构师胡旷,朗歌科技副总经理、智驾地图事业部总经理李战斌已确认参会并将带来主题分享。 👀 导读 视觉语言模型(VLMs)的最新进展使其在自动驾驶的视觉问答(VQA)中变得至关重要,实现了自然的人机交互。然而,现有方法在动态驾驶环境中往往表现不佳,因为它们通常专注于静态图像或视频,并依赖降采样以管理计算成本。这导致关键细节的丢失,以及空间和时间信息的有效整合的困难,这对细粒度感 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览