注册登录

专栏名称: arXiv每日学术速递

跟踪计算机视觉、人工智能、机器学习、NLP、语音识别、量化金融等热门方向学术信息

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

目录

相关文章推荐

南昌晚报 · 电影《热烈》重映，女演员宋祖儿戏份未删减冲上热搜 · 7 小时前

南昌晚报 · 电影《热烈》重映，女演员宋祖儿戏份未删减冲上热搜 · 7 小时前

今天看啥 › 专栏 › arXiv每日学术速递

融合 Mamba 与 Transformer | MaskMamba 引领非自回归图像合成,推理速度提升 54.44% !

arXiv每日学术速递 · 公众号 · · 2024-10-31 12:58

文章预览

图像生成模型遇到了与可扩展性和二次复杂性相关的挑战，主要原因是依赖于基于Transformer的 Backbone 网络。在本研究中，作者引入了一种新颖的混合模型MaskMamba，它结合了Mambo和Transformer架构，使用Masked Image Modeling进行非自回归图像合成。作者仔细重新设计了双向Mamba架构，通过实现两个关键的修改：（1）用标准卷积替换因果卷积，以更好地捕捉全局上下文；（2）用 ConCat 而不是乘法，这显著提高了性能，同时加快了推理速度。此外，作者还探索了MaskMamba的各种混合方案，包括串行和分组并行排列。此外，作者引入了一个在语境中的条件，使得作者的模型可以执行分类到图像和文本到图像生成任务。 MaskMamba 在生成质量上超过了基于Mamba和Transformer的模型。值得注意的是，它实现了在2048x2048分辨率下推理速度的54.44%的显著提升。 1 Introduction 近年 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

南昌晚报 · 电影《热烈》重映，女演员宋祖儿戏份未删减冲上热搜

7 小时前

南昌晚报 · 电影《热烈》重映，女演员宋祖儿戏份未删减冲上热搜

7 小时前

知识管理中心KMCenter · 加入二班听64次学习和思维能力讲座

9 月前

游资八戒 · 【龙头板块——波段套装】——1主图2幅图（4选股）

8 月前

游资八戒 · 【龙头板块——波段套装】——1主图2幅图（4选股）

8 月前

游理游据研究院 · 诗悦创想大厦|公司总部系列

3 月前

史事挖掘机 · 人到中年，异性间的“越轨”行为，大多是从默许这几件事开始

1 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号