视觉Transformer与Mamba的创新改进，完美融合（附论文及源码）

江大白 · 公众号 · · 2024-07-17 08:00

文章预览

以下文章来源于微信公众号：AI视界引擎作者：AI引擎链接：https://mp.weixin.qq.com/s/nVRA0JlkOmSUXpaub1VPTg 本文仅用于学术分享，如有侵权，请联系后台作删文处理导读最近，一种基于状态空间结构的 Mamba模型在学术届爆火，该模型实现了线性时间复杂度，并在不同建模任务中优于或匹配Transformers。为了提升长距离空间依赖关系的建模能力，作者提出混合Mamba-Transformer架构( MambaVision )。实验表明，该模型在 ImageNet-1K、MS COCO和ADE20K数据集上达到了最先进的SOTA性能！论文链接： https://arxiv.org/abs/2407.08083 代码链接： https://github.com/NVlabs/MambaVision 作者提出了一种新颖的混合Mamba-Transformer架构，称为MambaVision，这是专门为视觉应用量身定制的。作者的核心贡献包括重新设计Mamba公式，以增强其高效建模视觉特征的能力。此外，作者还对将视觉Transformer（ViT）与Ma ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

参考消息 · 突发！澳大利亚一飞机坠毁

15 小时前

香港365天 · 内地女生因香港街头做了这个动作，引发网友争执！

昨天

香港365天 · 内地女生因香港街头做了这个动作，引发网友争执！

昨天

参考消息 · 爆料：乌军总司令或被解职

昨天

参考消息 · 以防长：伊朗核设施如今更容易遭到破坏

5 天前

参考消息 · “5个多小时”，普京挥了挥拳头

5 天前

青塔 · 理工类可投优质岗位，年薪25W！

4 月前

江南晚报 · 知名餐饮品牌宣布：关店14家！无锡情况……

2 月前