文章预览
点击下方卡片,关注 「AI视界引擎」 公众号 ( 添加时备注:方向+学校/公司+昵称/姓名 ) RGB-D显著目标检测(SOD)的目的是在图像中准确地确定最显眼区域。尽管传统的深度模型严重依赖卷积神经网络提取器,忽视了长程上下文依赖关系,但后续基于 Transformer 的模型在某种程度上解决了这个问题,但引入了高计算复杂度。 此外,从深度图获取空间信息已被证明对于这个任务是有效的。 这个问题的一个主要挑战是如何有效地融合RGB和深度信息的互补信息。 在本文中,作者提出了一种名为MambaSOD的双Mamba驱动跨模态融合网络,用于RGB-D SOD。 具体来说,作者首先为RGB和深度设计了一个双Mamba驱动的特征提取器,以在多个模态输入中建模多模态输入中的长程依赖关系,其复杂度为线性。 然后,作者设计了一个捕捉到的多模态特征的跨模态融合Mamba,以充分
………………………………