专栏名称: 魔搭ModelScope社区
阿里巴巴达摩院模型开源社区ModelScope官方账号
今天看啥  ›  专栏  ›  魔搭ModelScope社区

可控高清视频生成: CogVideoX+DiffSynth-Studio = “配置拉满”

魔搭ModelScope社区  · 公众号  ·  · 2024-09-05 22:53

文章预览

不久前,CogVideoX 开源了 5B 版本的文生视频模型。现在,开源项目 DiffSynth-Studio 为 CogVideoX 提供了更强大的功能支持。在本期文章中,我们一起来看一下,在 DiffSynth-Studio 的加持下, “配置拉满”的 CogVideoX 有多强! 01 样例展示 首先我们生成一个骑马的宇航员,使用的提示词是“an astronaut riding a horse on Mars.”。 示例代码: from diffsynth import ModelManager, save_video, VideoData, download_models, CogVideoPipeline from diffsynth.extensions.RIFE import RIFEInterpolater import torch, os os.environ["TOKENIZERS_PARALLELISM"] = "True" def text_to_video(model_manager, prompt, seed, output_path): pipe = CogVideoPipeline.from_model_manager(model_manager) torch.manual_seed(seed) video = pipe( prompt=prompt, height=480, width=720, cfg_scale=7.0, num_inference_steps=200 ) save_video(video, output_path, fps=8, quality=5) download_models(["CogVideoX-5B", ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览