今天看啥  ›  专栏  ›  数字生命卡兹克

智谱AI上线4K60帧"新清影",还要直接开源,我觉得他们疯了。

数字生命卡兹克  · 公众号  ·  · 2024-11-08 14:34

主要观点总结

智谱公司发布了全新的AI视频模型“新清影”,并开源了其底层模型CogVideoX v1.5。新模型在视频生成、音效匹配等方面有显著提升,且正在形成全模态模型的生态。作者对此表示敬意并对新清影的进步表示赞扬。同时,智谱的AI音效模型也受到了作者的肯定。

关键观点总结

关键观点1: 智谱发布全新AI视频模型“新清影”并上线智谱清言。

该模型具有10s、4k、60帧的视频生成能力,并能自带生成匹配的AI音效。模型已经人人可用。

关键观点2: 智谱开源了底层模型CogVideoX v1.5。

作者对新清影的进步表示赞扬,并认为智谱的开源行为值得敬佩。CogVideoX v1.5已经第一时间被作者测试过。

关键观点3: 智谱的AI音效模型受到肯定。

作者通过案例展示了智谱AI音效模型的适配性和效果,认为它能够为视频带来更好的沉浸感。

关键观点4: 智谱的全模态模型生态正在发展。

虽然目前各模态的模型都是独立的,但作者有预感它们未来会相互连接,形成一道坚不可摧的巨大的面。作者认为这就是生态的优势。


文章预览

就在刚刚,智谱宣布全新迭代的AI视频模型“新清影”,正式上线。 10s、4k、60帧,还能自带生成挺匹配的AI音效。 视频模型已经上线智谱清言上,人人可用。音效模型这个月也即将上线。 这个点,其实还好,就是线上模型迭代升级了一版而已。 但是最牛逼的是,他们直接宣布,把这个“新清影”背后的底层模型,也就是 CogVideoX v1.5,直接开源了。。。 我觉得他们疯了,真的。 上上周发类似GPT4o那种端到端的语音对话模型也是,直接发布即开源。 真的,智谱给我整不会了。 周二才夸过腾讯混元,开源了他们参数最大的MoE模型混元Large和AI 3D模型Hunyuan3D-1.0。 现在智谱直接接力,直接开源了他们内部效果最好的AI视频模型。 还是那句话,对于每一个愿意开源,让社会、让开源社区,百尺竿头更进一步的公司。我都永远报以最崇高的敬意,和最大的善 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览