专栏名称: ADFeed
🧠 AI DevFeed:AI 技术研习与产业观察。
今天看啥  ›  专栏  ›  ADFeed

CxD:美图公司结合艺术创作流程打造的复杂场景图像生成框架

ADFeed  · 公众号  ·  · 2024-09-14 11:15

文章预览

Draw Like an Artist: Complex Scene Generation with Diffusion Model via Composition, Painting, and Retouching 论文: https://arxiv.org/abs/2408.13858v1 Complex Diffusion (CxD) 是由来自美图科技MT Lab和中科院大学的研究人员提出的一种新型训练无关扩散框架,旨在解决复杂场景图像生成中的挑战。 CxD 框架借鉴了艺术家的创作流程,将图像生成过程划分为构图、绘画和修饰三个阶段。通过利用大型语言模型(LLMs)的强大推理能力,CxD能够根据复杂分解标准(CDC)有效地处理和简化复杂的文本提示,确保在图像生成过程中包含所有关键实体和属性。此外,CxD通过注意力调制方法和修饰模型增强了图像的细节和纹理,从而生成高质量、语义一致且视觉多样的复杂场景图像。 CxD 框架的特点是其无需额外训练即可直接应用于现有的扩散模型,这大大减少了计算资源的需求。通过链式思考(Chain-o ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览