主要观点总结
本文介绍了市面AI产品的发展趋势以及最新升级的一款AI视频生成产品——新清影。新清影在视频生成方面有了显著的升级,包括视频质量、时长、比例控制、音效生成等功能。文章详细描述了新清影的升级特点和亮点技术,如模型能力提升、视频美学表现、运动合理性等,以及未来可能的发展方向和个性化服务。
关键观点总结
关键观点1: 新清影的升级特点
包括视频时长延长至10s、4K超高清画质、任意尺寸支持、自带音效、人体动作和物理世界模拟能力增强等。
关键观点2: 新清影的亮点技术
包括模型能力提升、使用自动化数据筛选框架过滤视频素材、三维变分自编码器结构等。
关键观点3: 音效模型CogSound和音乐模型CogMusic的应用
基于视频理解能力为视频添加合适的配音,生成应景的音效,如爆炸、水流等声音。
关键观点4: 未来AI视频发展的方向
随着国内清影新功能的不断上线和优化,未来清影将突破更多技术瓶颈,朝着智能化方向发展,提供个性化的视频生成建议。
文章预览
市面上的AI产品发布之后,大多会随着时间推移变得越来越强。 几个月前果核给大家介绍过清影AI生成视频功能,当时基于视频生成模型 CogVideoX 的清影上线清言 app,只用一段指令和一张图就能在半分钟内容生成6s 1440x960 清晰度的视频, 也是国内最早开放出来,“人人可用”的生成视频功能。 而最近,“新清影”进行了大幅度升级,来到了 Next level。 (新清影-图生视频2.0) 这次升级的点有:10s时长、4k、60 帧超高清画质、任意尺寸,自带音效,以及更好人体动作和物理世界模拟。 最重要的是: 这些功能(音效本月上线)都 上线了智谱清言 app,用到的模型CogVideoX V1.5 也同步开源! 首先是可以体验到的图片转视频,视频生成 的 质量更高,时间更长。之前的视频生成尺寸为6s的1440*960,升级后可以生成10s的4K视频, 时长后续还会升级到16s ! 除了时
………………………………