专栏名称: PaperWeekly
PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区:http://paperweek.ly | 微博:@PaperWeekly
今天看啥  ›  专栏  ›  PaperWeekly

超越扩散模型!度小满、中科大等联合提出全新自回归通用文生图模型

PaperWeekly  · 公众号  · 科研  · 2024-06-26 13:14
项目网站:https://krennic999.github.io/STAR/论文链接: https://arxiv.org/pdf/2406.10797背景介绍通用文本引导图像生成领域近年受到广泛关注,在二次创作, 虚拟试穿和原型设计领域得到广泛应用。艺术家和设计师利用它重新构思和创新现有作品。消费者通过生成图像预览服装和配饰,提升购物体验。设计师能快速生成产品概念图,节省时间和资源。尤其扩散模型(Diffusion)由于其高质量和多元的生成,在文生图领域占有主导地位。通过逐步的去噪过程,为图像生成提供了更强的稳定性和可控性,然而也导致生成过程及其耗时。自回归(Auto-regressive,AR)模型通过离散视觉编码器(VQ-VAE,d-VAE 等)将图像转化为离散 token,训练模型按顺序逐个预测新的 token,预测的整个 token map 解码即可得到生成的图像。受大语言模型的启发,自回归模型在这一领域的应用也逐 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照