专栏名称: 将门创投
将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。
今天看啥  ›  专栏  ›  将门创投

ECCV 2024 Oral | SPLAM:基于子路径线性近似的扩散模型加速方法

将门创投  · 公众号  · 科技创业  · 2024-08-30 08:22

文章预览

本文介绍南京大学和阿里巴巴在扩散模型加速任务上的新工作: SPLAM: Accelerating Image Generation with Sub-Path Linear Approximation Model 。本工作主要解决扩散模型在采样过程中需要多步导致推理速度较慢,针对现有的LCM存在的累积误差较大的问题进行优化,通过提出线性ODE采样方法,进一步提升了生图的质量和速度。在四步推理的设置下,在COCO30k和COCO5k上分别取得了10.06和20.77的FID分数,在加速模型方法中达到了SOTA效果。 论文标题:  SPLAM: Accelerating Image Generation with Sub-Path Linear Approximation Model  论文链接: https://arxiv.org/abs/2404.13903 代码链接: https://github.com/MCG-NJU/SPLA 项目主页: https://subpath-linear-approx-model.github.io/ 一、引言 扩散模型目前已经成为文本生成图片领域使用最为广泛的模型,其通过逐步去噪步骤来从一张高斯噪声采样生成真实分布中的图片。然而 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览