今天看啥  ›  专栏  ›  自动驾驶Daily

CoVLA:用于自动驾驶的综合视觉-语言-动作数据集

自动驾驶Daily  · 公众号  ·  · 2024-08-30 19:10

文章预览

点击下方 卡片 ,关注“ 自动驾驶Daily ”公众号 戳我-> 领取近15个自动驾驶方向路线 今天自动驾驶Daily今天为大家分享一篇用于自动驾驶的综合视觉-语言-动作数据集工作。如果您有相关工作需要分享,请在文末联系我们! 自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询 >> 点击进入→ 自动驾驶Daily技术交流群 本文只做学术分享,如有侵权,联系删文 原标题:CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving 论文链接:https://arxiv.org/pdf/2408.10845 作者单位:Turing Inc. 东京大学 University of Tsukuba Keio Research Institute at SFC National Institute of Informatics 论文思路: 自动驾驶,特别是在复杂和意外场景中的导航,要求具备复杂的推理和规划能力。虽然多模态大语言模型(MLLMs)在这方面提供了一个有前途的途径,但其应用 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览