专栏名称: 自动驾驶之星
自动驾驶之星,是一个以自动驾驶量产交流为主的社区。这里有自动驾驶量产第一线的前沿动态,有一群奋斗在自动驾驶量产第一线的小伙伴在分享他们的量产经历。期待你的加入!希望每个人在这个浪潮中都能成为自动驾驶之星!
今天看啥  ›  专栏  ›  自动驾驶之星

VLM大模型在自动驾驶领域的创新应用--2024 年 PRCV 自动驾驶挑战赛冠军解决方案

自动驾驶之星  · 公众号  ·  · 2024-11-06 16:24
    

文章预览

随着大模型技术的发展,越来越多的大模型技术被应用到了自动驾驶中。我们在 这些年我们一起追过的自动驾驶端到端范式! 也介绍过了VLM方案目前在自动驾驶中的使用情况,今天我们带来PRCV 自动驾驶挑战赛冠军解决方案。https://arxiv.org/pdf/2411.02999 🌐 VLM大模型:自动驾驶的新引擎 在本文中,我们基于InternVL-2.0,这是一个开源的多模态大型语言模型,它能够处理和推理文本、图像和视频数据。这一技术的应用,使得自动驾驶系统能够更全面地理解和响应复杂的驾驶场景。 🔬 多视角图像输入:超越单视角的局限 我们的团队通过技术创新,将多视角图像拼接成单一格式,每个视角图像被调整至896x448像素,最终合成的图像尺寸达到2688x896像素。这一方法不仅提高了数据的维度,还增强了模型对视角间上下文信息的捕捉能力,为自动驾驶系统提供了 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览