文章预览
本文介绍南京大学和阿里巴巴在扩散模型加速任务上的新工作: SPLAM: Accelerating Image Generation with Sub-Path Linear Approximation Model 。本工作主要解决扩散模型在采样过程中需要多步导致推理速度较慢,针对现有的LCM存在的累积误差较大的问题进行优化,通过提出线性ODE采样方法,进一步提升了生图的质量和速度。在四步推理的设置下,在COCO30k和COCO5k上分别取得了10.06和20.77的FID分数,在加速模型方法中达到了SOTA效果。 论文标题: SPLAM: Accelerating Image Generation with Sub-Path Linear Approximation Model 论文链接: https://arxiv.org/abs/2404.13903 代码链接: https://github.com/MCG-NJU/SPLA 项目主页: https://subpath-linear-approx-model.github.io/ 一、引言 扩散模型目前已经成为文本生成图片领域使用最为广泛的模型,其通过逐步去噪步骤来从一张高斯噪声采样生成真实分布中的图片。然而
………………………………