文章预览
AIGC Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) Topic: Image Generation|Text-guided Editing|Task-Oriented Diffusion Inversion, Free-text Embedding Control, DiT & Fine-grained Semantic Editing Task-Oriented Diffusion Inversion for High-Fidelity Text-based Editing 2024-08-23|HKU, Shanghai AI Lab, OUC, SMU, SCUT|⭐️ 🟡 http://arxiv.org/abs/2408.13395v1 概述 在本研究中,我们提出了一种新的框架—— 任务导向扩散反演(Task-Oriented Diffusion Inversion, TODInv),旨在通过优化提示嵌入在扩展的P*空间中实现对真实图像的高保真编辑 。尽管近年来文本引导的扩散模型在图像操作方面取得了显著进展,但在重建保真度和可编辑性之间存在挑战。通过利用不同U-Net层和时间步长间的独特嵌入,TODInv能有效无缝地将反演过程与编辑任务整合起来,同时确保高保真度和精准的可编辑性。我们将编辑任务分
………………………………