NVIDIA Research 研究科学家李柏依：探索基于多模态LLM 的自动驾驶智能体 | 公开课预告

智猩猩Auto · 公众号 · · 2024-10-17 19:06

文章预览

让自动驾驶系统适应新环境和不同地区的习惯和法规是自动驾驶领域长期面临的挑战。NVIDIA Research 团队提出的自动驾驶智能体 LLaDA 能够利用 LLM 生成适应不同环境的驾驶策略和指令，为驾驶员和自动驾驶汽车提供多语言和地区交通规则的实时指导，帮助他们更轻松地在陌生的地方导航。此外，LLaDA 还能帮助自动驾驶汽车重新规划出与当地环境更加匹配的运动轨迹，调整自动驾驶汽车的运动规划策略。相关论文成果收录于 CVPR 2024 。然而，LLaDA 无法实现场景的自动识别，且对场景描述的质量有着较高要求。尽管 GPT-4V 能够提供这种描述，但是却不够准确。为此，NVIDIA Research 提出一个创新的自动化视频字幕生成框架 Wolf。Wolf 采用专家混合方法，利用视觉语言模型(VLMs)的互补优势，能够提升自动驾驶智能体的场景理解能力。此外，LLaDA 通常是与用户 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

跟宇宙结婚 · 节目更新：跟宇宙结婚悄悄话 vol.232 三樽球星伙子解梦

3 天前

质安选 · 【一起食安行×纽勤】微生物标准与检验技术交流会暨纽勤Petrifilm测试片上市40周年年庆——郑州专场开始报名啦~

4 天前

跟宇宙结婚 · 1998年，我通过这两本杂志和磁带开始入门日本流行音乐｜跟宇宙结婚

5 天前

食品580 · 标注“0防腐剂”产品检出多种食品添加剂

1 周前

广西师乐 · 新出！广西壮族自治区水利厅幼儿园招聘专任教师！全部实名编制！

4 月前

集邮本子 · TP43《秦始皇帝陵兵马俑》7月15日发行

4 月前