文章预览
点击下方卡片,关注 「AI视界引擎」 公众号 ( 添加时备注:方向+学校/公司+昵称/姓名 ) 选择性状态空间模型(SSMs),如Mamba(Gu & Dao,2023),在捕捉一维序列数据中的长期依赖性方面表现出色,但其应用于2D视觉任务仍面临挑战。当前的视觉SSM通常将图像转换为一维序列,并采用各种扫描模式来包含局部空间依赖性。 然而,这些方法在有效捕捉复杂图像空间结构和由于扫描路径加长导致的计算成本增加方面存在局限性。 为解决这些问题,作者提出了一种新颖的方法Spatial-Mamba,它直接在状态空间中建立邻域连通性。 作者不再仅依赖顺序状态转换,而是引入了一个_结构感知状态融合_方程,该方程利用膨胀卷积来捕捉图像空间结构依赖性,显著增强了视觉上下文信息的 Stream 。 Spatial-Mamba分为三个阶段:单向扫描的初始状态计算,通过结构感知状态
………………………………