文本到图像合成：十年回顾

专知 · 公众号 · · 2024-11-27 11:00

文章预览

当人类阅读特定文本时，往往会将其与相应的图像进行联想，我们希望计算机也能做到这一点。文本到图像合成（T2I）旨在从文本描述中生成高质量的图像，已成为人工智能生成内容（AIGC）的一个重要方向，并且是人工智能研究中的一项变革性技术。基础模型在T2I中发挥着关键作用。本调查综述了超过440篇关于T2I的最新研究成果。我们首先简要介绍了生成对抗网络（GANs）、自回归模型和扩散模型在图像生成中的应用。在此基础上，我们讨论了这些模型在T2I中的发展，重点关注它们在文本条件下的生成能力和多样性。我们还探讨了T2I研究的前沿进展，涉及性能、可控性、个性化生成、安全性问题以及内容一致性和空间关系的保持等多个方面。此外，我们总结了T2I研究中常用的数据集和评估指标。最后，我们讨论了T2I在AIGC中的潜在应用，以及该领域 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博