文章预览
点击下方 卡片 ,关注“ 自动驾驶之心 ”公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 今天自动驾驶之心为大家分享一篇用于自动驾驶的端到端视觉语言模型:SimpleLLM4AD! 如果您有相关工作需要分享,请在文末联系我们! 自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询 >> 点击进入→ 自动驾驶之心 『 大语言模型 』 技术交流群 编辑 | 自动驾驶之心 论文信息 题目:SimpleLLM4AD: An End-to-End Vision-Language Model with Graph Visual Question Answering for Autonomous Driving 作者:Peiru Zheng, Yun Zhao, Zhan Gong, Hong Zhu, Shaohua Wu 机构:IEIT Systems 原文链接:https://arxiv.org/html/2407.21293v1 内容速览 作者 利用GVQA的逻辑依赖性 ,使用相关问题的答案作为当前问题的上下文信息,显著 提高了LLMs在准确性(ACC)和语言得分方面的能力 。 作者优化了
………………………………