专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
目录
今天看啥  ›  专栏  ›  专知

文本到图像合成:十年回顾

专知  · 公众号  ·  · 2024-11-27 11:00
    

文章预览

当人类阅读特定文本时,往往会将其与相应的图像进行联想,我们希望计算机也能做到这一点。文本到图像合成(T2I)旨在从文本描述中生成高质量的图像,已成为人工智能生成内容(AIGC)的一个重要方向,并且是人工智能研究中的一项变革性技术。基础模型在T2I中发挥着关键作用。本调查综述了超过440篇关于T2I的最新研究成果。我们首先简要介绍了生成对抗网络(GANs)、自回归模型和扩散模型在图像生成中的应用。在此基础上,我们讨论了这些模型在T2I中的发展,重点关注它们在文本条件下的生成能力和多样性。我们还探讨了T2I研究的前沿进展,涉及性能、可控性、个性化生成、安全性问题以及内容一致性和空间关系的保持等多个方面。此外,我们总结了T2I研究中常用的数据集和评估指标。最后,我们讨论了T2I在AIGC中的潜在应用,以及该领域 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览