文章预览
用于文本到视频生成的图像扩散模型的一次性调整 源代码一经发布,迅速登上开源社区榜单 源代码 http://www.gitpp.com/datasets/wenben-shipin 用于文本到视频生成的图像扩散模型的一次性调整 Jay Zhangjie Wu、 Yixiao Ge、 Xintao Wang、 Stan Weixian Lei、 Yuchao Gu、 Yufei Shi、 Wynne Hsu、 Ying Shan、 Xiaohu Qie、 Mike Zheng Shou [稳定扩散] 稳定扩散是一种潜在的文本到图像扩散模型,能够根据任何文本输入生成照片般逼真的图像。预先训练的稳定扩散模型可以从 Hugging Face 下载(例如,稳定扩散 v1-4、v2-1)。您还可以使用针对不同风格训练的微调稳定扩散模型(例如,现代迪士尼、Anything V4.0、Redshift等)。 [DreamBooth] DreamBooth是一种个性化文本转图像模型的方法,例如仅给出主题的几张图像(3~5 张图像),即可生成稳定扩散。在 DreamBooth 模型上调整视频可以生成
………………………………