文章预览
Allegro 是一个强大的文本转视频模型,可以通过简单的文本输入生成长达 6 秒、15 FPS 和 720p 分辨率的高质量视频。 主要特点 • 开源:完整的模型权重和代码可供社区使用,Apache 2.0! • 多样化的内容创作:能够生成各种各样的内容,从人类和动物的特写镜头到各种动态场景。 • 高质量输出:以 15 FPS 的速度生成 6 秒的详细视频,分辨率为 720x1280,可以使用EMA-VFI插值到 30 FPS 。 • 小巧高效:具有 175M 参数 VideoVAE 和 2.8B 参数 VideoDiT 模型。支持多种精度(FP32、BF16、FP16),在 BF16 模式下使用 9.3 GB GPU 内存,并具有 CPU 卸载功能。上下文长度为 79.2K,相当于 88 帧。 相关链接 • 论文:https://huggingface.co/rhymes-ai/Allegro • 代码:https://github.com/rhymes-ai/Allegro/tree/main • 试用:https://huggingface.co/rhymes-ai/Allegro • 图库:https://rhymes.ai/allegro_gallery 模型信息 Allegro
………………………………