文章预览
长话短说 就在刚刚,智谱开源了 CogVideoX 系列图生视频模型 CogVideoX-5B-I2V ,及其背后的标注模型 cogvlm2-llama3-caption 进一步的 在 CogVideoX-5B-I2V 中,允许输入「一张图像」+「提示词」,生成视频。 至此,CogVideoX系列模型已经支持文生视频、视频延长、图生视频三种任务。 地址 在这 : https://huggingface.co/THUDM/CogVideoX-5b-I2V 而 cogvlm2-llama3-caption ,则负责将视频数据,转换成文本描述,在这: https://huggingface.co/THUDM/cogvlm2-llama3-caption 效果 输入是「狗狗」图片 +「开心狗狗」文字: 输出是开心狗狗: 输入是「天命人」图片: 输出是「广智救我」动态壁纸: 参数 包括之前的几个模型,参数信息如下: 更新记录 在过去的1个月里,CogVideo 做了一堆的更新,梳理如下: 🔥 更新: 2024/9/16 添加自动化生成视频工具,你可以使用本地开源模型 + FLUX + CogVideoX 实
………………………………