专栏名称: Ai fighting
本公众号主要分享自动驾驶感知实战,从算法训练到模型部署。主要致力于3D目标检测,3D目标追踪,多传感器融合,Transform,BEV,OCC,模型量化,模型部署等方向的实战。
今天看啥  ›  专栏  ›  Ai fighting

VLM大模型在自动驾驶领域的创新应用--2024 年 PRCV 自动驾驶挑战赛冠军解决方案

Ai fighting  · 公众号  ·  · 2024-11-12 07:00

文章预览

随着大模型技术的发展,越来越多的大模型技术被应用到了自动驾驶中。我们在 这些年我们一起追过的自动驾驶端到端范式! 也介绍过了VLM方案目前在自动驾驶中的使用情况,今天我们带来PRCV 自动驾驶挑战赛冠军解决方案。https://arxiv.org/pdf/2411.02999 🌐 VLM大模型:自动驾驶的新引擎 在本文中,我们基于InternVL-2.0,这是一个开源的多模态大型语言模型,它能够处理和推理文本、图像和视频数据。这一技术的应用,使得自动驾驶系统能够更全面地理解和响应复杂的驾驶场景。  欢迎加入自动驾驶实战群 🔬 多视角图像输入:超越单视角的局限 我们的团队通过技术创新,将多视角图像拼接成单一格式,每个视角图像被调整至896x448像素,最终合成的图像尺寸达到2688x896像素。这一方法不仅提高了数据的维度,还增强了模型对视角间上下文信息的捕捉能 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览