文章预览
AIGC Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) ————A1.1 Part———— Topic: Image Generation|Autoregressive Transformer, Rectified Flow Transformers DART: Denoising Autoregressive Transformer for Scalable Text-to-Image Generation 2024-10-10|Apple, CUHK, Mila Quebec AI Institute|⭐️ 🟡 http://arxiv.org/abs/2410.08159v1 概述 DART(Denoising AutoRegressive Transformer)是一种新型的生成模型,旨在改进图像生成的效率和可扩展性。传统的扩散模型在训练和推理时受到马尔可夫性质的限制,无法充分利用生成过程的全貌,从而导致训练和推理效率低下。 DART通过将自回归建模与非马尔可夫扩散结合 ,提出了一种新的框架。该模型能够对图像补丁进行迭代去噪,采用与标准语言模型相同的架构,避免了图像量化,从而实现更灵活的图像建模。DART在类条件和文本到图像生成任务中表现出
………………………………