文章预览
当人类阅读特定文本时,往往会将其与相应的图像进行联想,我们希望计算机也能做到这一点。文本到图像合成(T2I)旨在从文本描述中生成高质量的图像,已成为人工智能生成内容(AIGC)的一个重要方向,并且是人工智能研究中的一项变革性技术。基础模型在T2I中发挥着关键作用。本调查综述了超过440篇关于T2I的最新研究成果。我们首先简要介绍了生成对抗网络(GANs)、自回归模型和扩散模型在图像生成中的应用。在此基础上,我们讨论了这些模型在T2I中的发展,重点关注它们在文本条件下的生成能力和多样性。我们还探讨了T2I研究的前沿进展,涉及性能、可控性、个性化生成、安全性问题以及内容一致性和空间关系的保持等多个方面。此外,我们总结了T2I研究中常用的数据集和评估指标。最后,我们讨论了T2I在AIGC中的潜在应用,以及该领域
………………………………