专栏名称: AIWalker
关注计算机视觉、图像处理、深度学习等领域的干货分享与前沿paper解读。AIWalker由具有多年算法研究与产品化落地经验的Happy运营,原创为主、同时会转载优秀解读文章。欢迎志同道合的小伙伴们加入一同学习进步。
今天看啥  ›  专栏  ›  AIWalker

去噪步数减少50%,图像生成质量反而更好!西湖大学等提出TPDM:自适应噪声调度

AIWalker  · 公众号  ·  · 2024-12-05 22:00
    

文章预览

关注 「 AIWalker 」 并 星标 从此AI不迷路 作者:Zilyu Ye 等     解读: AI生成未来 文章链接:https://arxiv.org/pdf/2412.01243 亮点直击 提出了 时间预测扩散模型(TPDM) ,该模型可以在推理过程中自适应地调整噪声调度,实现图像质量和模型效率之间的平衡。 为了训练TPDM,通过强化学习最大化图像质量,并根据去噪步骤数折扣,直接优化最终的性能和效率。 模型在多个评估基准上表现优越,在减少推理步数的同时取得了更好的结果。 总览全文 扩散模型和流模型在文本到图像生成等多种应用中取得了显著成功。然而,这些模型通常在推理过程中依赖于相同的预定去噪调度策略,这可能限制了推理效率以及在处理不同提示时的灵活性。本文认为,最优的噪声调度应该适应每个推理实例,并提出了 时间预测扩散模型(TPDM) 来实现这一目标。 TPDM采用了一 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览