专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
今天看啥  ›  专栏  ›  新智元

一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成

新智元  · 公众号  · AI  · 2025-03-31 12:29
    

文章预览

   新智元报道   编辑:LRS 好困 【新智元导读】 SANA-Sprint是一个高效的蒸馏扩散模型,专为超快速文本到图像生成而设计。通过结合连续时间一致性蒸馏(sCM)和潜空间对抗蒸馏(LADD)的混合蒸馏策略,SANA-Sprint在一步内实现了7.59 FID和0.74 GenEval的最先进性能。SANA-Sprint仅需0.1秒即可在H100上生成高质量的1024x1024图像,在速度和质量的权衡方面树立了新的标杆。 扩散生成模型通常需要50-100次迭代去噪步骤,效率很低,时间步蒸馏技术可以极大提高推理效率, 「基于分布的蒸馏」方法 ,如生成对抗网络GAN及其变分分数蒸馏VSD变体,以及 「基于轨迹的蒸馏方法」 (如直接蒸馏、渐进蒸馏、一致性模型)可以实现 10-100倍 的图像生成加速效果。 但仍然存在一些关键难点,比如基于GAN的方法由于对抗动态的振荡特性和模式坍塌问题,训练过程不稳定;基 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览