专栏名称: 自动驾驶之心
自动驾驶开发者社区,关注计算机视觉、多维感知融合、部署落地、定位规控、领域方案等,坚持为领域输出最前沿的技术方向!
今天看啥  ›  专栏  ›  自动驾驶之心

ECCV'24 | 多模态大模型:全面理解复杂长尾的开放驾驶场景

自动驾驶之心  · 公众号  ·  · 2024-08-11 00:00
    

文章预览

点击下方 卡片 ,关注“ 自动驾驶之心 ”公众号 戳我->  领取 自动驾驶近15个 方向 学习 路线 今天自动驾驶之心为大家分享一篇自动驾驶多模态语言模型DOLPHINS,已被ECCV2024接收! 如果您有相关工作需要分享,请在文末联系我们! 自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询 >> 点击进入→ 自动驾驶之心 『 多模态学习 』 技术交流群 编辑 | 自动驾驶之心 原标题:DOLPHINS: MULTIMODAL LANGUAGE MODEL FOR DRIVING 论文链接:https://arxiv.org/pdf/2312.00438 代码链接:https://github.com/SaFoLab-WISC/Dolphins 项目地址:https://vlm-driver.github.io/ 作者单位:威斯康星大学麦迪逊分校 NVIDIA 密歇根大学 斯坦福大学 论文思路: 探索完全自动驾驶汽车(AVs),使其能够在复杂的现实世界场景中以人类般的理解力和反应力进行导航一直是一个重要的目标 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览