专栏名称: 计算机视觉工坊
专注于计算机视觉、VSLAM、目标检测、语义分割、自动驾驶、深度学习、AI芯片、产品落地等技术干货及前沿paper分享。这是一个由多个大厂算法研究人员和知名高校博士创立的平台,我们坚持工坊精神,做最有价值的事~
今天看啥  ›  专栏  ›  计算机视觉工坊

ETH新作CAFuser:自动驾驶多模态语义感知新高度,多个下游任务SOTA!

计算机视觉工坊  · 公众号  ·  · 2024-11-10 00:00

文章预览

点击下方 卡片 ,关注 「3D视觉工坊」 公众号 选择 星标 ,干货第一时间送达 来源:计算机视觉工坊 0. 论文信息 标题:Condition-Aware Multimodal Fusion for Robust Semantic Perception of Driving Scenes 作者:Tim Broedermann, Christos Sakaridis, Yuqian Fu, Luc Van Gool 机构:ETH Zurich、Sofia University St. Kliment Ohridski 原文链接:https://arxiv.org/abs/2410.10791 1. 导读 利用多个传感器对于自动驾驶中强大的语义感知至关重要,因为每种传感器类型都有互补的优势和劣势。然而,现有的传感器融合方法通常在所有条件下一致地对待传感器,导致次优性能。相比之下,我们提出了一种新的,条件感知的多模态融合方法,用于驾驶场景的鲁棒语义感知。我们的方法CAFuser使用RGB摄像头输入对环境条件进行分类,并生成一个条件令牌来指导多种传感器模态的融合。我们还新推出了特定于设备的功能适 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览