文章预览
↑ 点击 蓝字 关注极市平台 作者丨Zongze Wu等 来源丨AI生成未来 编辑丨极市平台 极市导读 首个在少步扩散模型背景下探索图像编辑的工作,也是首个在扩散模型中探索基于编码器反演的工作。 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 论文链接: https://arxiv.org/pdf/2408.08332 亮点直击 提出一个反演网络,该网络通过预测噪声来重建输入图像,并被训练为在前一步重建的条件下迭代地校正重建图像。 对扩散蒸馏过程的一种新兴特性进行分析。 方法在反演过程中只需要 8 次功能评估(一次性成本),每次编辑只需 4 次功能评估,而基于多步扩散模型的方法在反演中需要 50 次功能评估,每次编辑需要 30-50 次功能评估。本文方法速度显著提升(每次编辑小于 0.5 秒,而不是大于 3 秒),且在描述性和指令性文本提示设置中,在文本图
………………………………