文章预览
AIGC Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) Topic: Image Generation| 1. Hybrid Autoregressive 2. Set Autoregressive HART: Efficient Visual Generation with Hybrid Autoregressive Transformer HART 2024-10-14|MIT, NVIDIA, THU|⭐️ 🟡 http://arxiv.org/abs/2410.10812v1 https://hanlab.mit.edu/projects/hart https://hart.mit.edu/ 概述 本文介绍了一种新型的视觉生成模型——混合自回归变换器(HART),该模型能够直接生成1024×1024像素的图像,其图像质量与当前最先进的扩散模型相媲美。HART克服了现有自回归模型在图像重建质量和训练成本上的限制,通过引入混合标记器来有效地将连续潜在变量分解为离散和连续两个部分。这种方法不仅提高了图像重建的效果,还显著降低了计算资源的消耗。与现有的扩散模型相比,HART在生成速度和效率上具有明显优势,提供了更高的吞吐量和更低的
………………………………