文生视频出现突破，华人实验登上全球榜单

GitHubFun网站 · 公众号 · · 2024-06-26 09:18

文章预览

用于文本到视频生成的图像扩散模型的一次性调整源代码一经发布，迅速登上开源社区榜单源代码 http://www.gitpp.com/datasets/wenben-shipin 用于文本到视频生成的图像扩散模型的一次性调整 Jay Zhangjie Wu、 Yixiao Ge、 Xintao Wang、 Stan Weixian Lei、 Yuchao Gu、 Yufei Shi、 Wynne Hsu、 Ying Shan、 Xiaohu Qie、 Mike Zheng Shou [稳定扩散] 稳定扩散是一种潜在的文本到图像扩散模型，能够根据任何文本输入生成照片般逼真的图像。预先训练的稳定扩散模型可以从 Hugging Face 下载（例如，稳定扩散 v1-4、v2-1）。您还可以使用针对不同风格训练的微调稳定扩散模型（例如，现代迪士尼、Anything V4.0、Redshift等）。 [DreamBooth] DreamBooth是一种个性化文本转图像模型的方法，例如仅给出主题的几张图像（3~5 张图像），即可生成稳定扩散。在 DreamBooth 模型上调整视频可以生成 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博