今天看啥  ›  专栏  ›  赛博禅心

智谱开源:图生视频模型 & 视频标注模型

赛博禅心  · 公众号  ·  · 2024-09-19 02:00

文章预览

长话短说 就在刚刚,智谱开源了  CogVideoX 系列图生视频模型 CogVideoX-5B-I2V ,及其背后的标注模型  cogvlm2-llama3-caption 进一步的 在 CogVideoX-5B-I2V 中,允许输入「一张图像」+「提示词」,生成视频。 至此,CogVideoX系列模型已经支持文生视频、视频延长、图生视频三种任务。 地址 在这 : https://huggingface.co/THUDM/CogVideoX-5b-I2V 而  cogvlm2-llama3-caption ,则负责将视频数据,转换成文本描述,在这: https://huggingface.co/THUDM/cogvlm2-llama3-caption 效果 输入是「狗狗」图片 +「开心狗狗」文字: 输出是开心狗狗: 输入是「天命人」图片: 输出是「广智救我」动态壁纸: 参数 包括之前的几个模型,参数信息如下: 更新记录 在过去的1个月里,CogVideo 做了一堆的更新,梳理如下: 🔥 更新: 2024/9/16 添加自动化生成视频工具,你可以使用本地开源模型 + FLUX + CogVideoX 实 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览