专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像,中科大哈工大度小满出品

量子位  · 公众号  · AI  · 2024-06-26 14:40
    

文章预览

STAR团队 投稿自 凹非寺 量子位 | 公众号 QbitAI 超越扩散模型! 自回归范式在图像生成领域再次被验证—— 中科大、哈工大、度小满等机构提出 通用文生图模型STAR 。 仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。 此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。 来看看具体是如何做到的? 自回归通用文生图模型STAR 扩散模由于其高质量和多元的生成,一度在文生图领域占有主导地位。 它通过逐步的去噪过程,为图像生成提供了更强的稳定性和可控性,然而也导致生成过程极其耗时。 而自回归模型的潜力,在受到大语言模型启发下,开始在这一领域逐渐被探索。 比如 VAR 指出是因为自回归模型逐个预测token的行为不符合图像模态的特点,提出“next-scale prediction”范式,将视觉自回归建模为逐个预测更大尺 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览