融合 Mamba 与 Transformer 优势， R2Gen-Mamba 从卷积到全连接层的特征提取与分类 !

灵度智能 · 公众号 · · 2024-11-14 12:10

文章预览

点击下方卡片，关注「AI视界引擎」公众号 ( 添加时备注：方向+学校/公司+昵称/姓名 ) 选择性状态空间模型（SSMs），如Mamba（Gu & Dao，2023），在捕捉一维序列数据中的长期依赖性方面表现出色，但其应用于2D视觉任务仍面临挑战。当前的视觉SSM通常将图像转换为一维序列，并采用各种扫描模式来包含局部空间依赖性。然而，这些方法在有效捕捉复杂图像空间结构和由于扫描路径加长导致的计算成本增加方面存在局限性。为解决这些问题，作者提出了一种新颖的方法Spatial-Mamba，它直接在状态空间中建立邻域连通性。作者不再仅依赖顺序状态转换，而是引入了一个_结构感知状态融合_方程，该方程利用膨胀卷积来捕捉图像空间结构依赖性，显著增强了视觉上下文信息的 Stream 。 Spatial-Mamba分为三个阶段：单向扫描的初始状态计算，通过结构感知状态 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

禽报网 · 鸡报•12-19\\毛鸡全线飘红；翅中L、翅根L、凤爪等领衔，冻品持续走强！

5 天前

游戏研究社 · 448元独占一只猫，大厂单机游戏在面临怎样的困境？

6 月前

珠三角商业地产 · 谷子店扎堆涌现，深圳MALL“含谷量”调研

5 月前

上海本地宝 · “贝碧嘉”横穿上海！风大雨大！地铁今日多线停运！又有新台风生成......

3 月前

他们都叫我柯基 · iOS 17.7.2 正式版发布，苹果建议更新！

1 月前