专栏名称: 计算机视觉工坊

专注于计算机视觉、VSLAM、目标检测、语义分割、自动驾驶、深度学习、AI芯片、产品落地等技术干货及前沿paper分享。这是一个由多个大厂算法研究人员和知名高校博士创立的平台，我们坚持工坊精神，做最有价值的事~

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

ETH新作CAFuser：自动驾驶多模态语义感知新高度，多个下游任务SOTA！

计算机视觉工坊 · 公众号 · · 2024-11-10 00:00

文章预览

点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达来源：计算机视觉工坊 0. 论文信息标题：Condition-Aware Multimodal Fusion for Robust Semantic Perception of Driving Scenes 作者：Tim Broedermann, Christos Sakaridis, Yuqian Fu, Luc Van Gool 机构：ETH Zurich、Sofia University St. Kliment Ohridski 原文链接：https://arxiv.org/abs/2410.10791 1. 导读利用多个传感器对于自动驾驶中强大的语义感知至关重要，因为每种传感器类型都有互补的优势和劣势。然而，现有的传感器融合方法通常在所有条件下一致地对待传感器，导致次优性能。相比之下，我们提出了一种新的，条件感知的多模态融合方法，用于驾驶场景的鲁棒语义感知。我们的方法CAFuser使用RGB摄像头输入对环境条件进行分类，并生成一个条件令牌来指导多种传感器模态的融合。我们还新推出了特定于设备的功能适 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博