智谱开源：图生视频模型 & 视频标注模型

赛博禅心 · 公众号 · · 2024-09-19 02:00

文章预览

长话短说就在刚刚，智谱开源了 CogVideoX 系列图生视频模型 CogVideoX-5B-I2V ，及其背后的标注模型 cogvlm2-llama3-caption 进一步的在 CogVideoX-5B-I2V 中，允许输入「一张图像」+「提示词」，生成视频。至此，CogVideoX系列模型已经支持文生视频、视频延长、图生视频三种任务。地址在这： https://huggingface.co/THUDM/CogVideoX-5b-I2V 而 cogvlm2-llama3-caption ，则负责将视频数据，转换成文本描述，在这： https://huggingface.co/THUDM/cogvlm2-llama3-caption 效果输入是「狗狗」图片 +「开心狗狗」文字：输出是开心狗狗：输入是「天命人」图片：输出是「广智救我」动态壁纸：参数包括之前的几个模型，参数信息如下：更新记录在过去的1个月里，CogVideo 做了一堆的更新，梳理如下： 🔥 更新: 2024/9/16 添加自动化生成视频工具，你可以使用本地开源模型 + FLUX + CogVideoX 实 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博