英伟达也对 Mamba下手了，视觉 Transformer 与 Mamba 的完美融合！

集智书童 · 公众号 · · 2024-07-17 09:00

文章预览

点击下方卡片，关注「AI视界引擎」公众号 ( 添加时备注：方向+学校/公司+昵称/姓名 ) 作者提出了一种新颖的混合Mamba-Transformer架构，称为MambaVision，这是专门为视觉应用量身定制的。作者的核心贡献包括重新设计Mamba公式，以增强其高效建模视觉特征的能力。此外，作者还对将视觉Transformer（ViT）与Mamba集成的可行性进行了全面的消融研究。作者的结果表明，在Mamba架构的最后几层配备几个自注意力块，大大提高了捕获长距离空间依赖关系的建模能力。基于作者的发现，作者引入了一系列具有分层架构的MambaVision模型，以满足各种设计标准。在ImageNet-1K数据集上的图像分类中，MambaVision模型变体在Top-1准确率和图像吞吐量方面达到了新的最先进（SOTA）性能。在MS COCO和ADE20K数据集上的下游任务，如目标检测、实例分割和语义分割中，MambaVision超越了 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

现代快报 · 刘亦菲，传来好消息

12 小时前

现代快报 · 刘亦菲，传来好消息

12 小时前

看电视 · 春交会直击||长短之变、精品创作、叙事突围，业界大咖论道剧集行业新趋势

2 天前

清华金融评论 · 深度：延迟退休带来什么影响？｜宏观经济

7 月前

上海房天下 · 上海土拍杀疯了！华润保利成最大赢家！第八批次土拍已官宣公示

4 月前

最强龙虎榜 · 顶级大佬都活跃起来了

2 月前

英伟达也对 Mamba下手了 ，视觉 Transformer 与 Mamba 的完美融合 ！

文章预览

英伟达也对 Mamba下手了，视觉 Transformer 与 Mamba 的完美融合！