主要观点总结
阿里巴巴的AI视频生成平台通义万相在云栖大会上宣布全面升级,推出自研的AI视频生成大模型,并面向公众免费开放。该平台具有文生视频和图生视频两个创作入口,支持一键生成音画同步视频,且针对中式元素进行优化。经过实测,通义万相在处理人物运动、音效生成、复杂语义理解等方面表现出色,但也存在一些问题,如人物不一致、动作奇怪等。与其他大厂AI视频生成产品相比,通义万相在移动端使用免费且致力于降低普通用户的使用门槛。
关键观点总结
关键观点1: 通义万相全面升级,推出自研AI视频生成大模型,并面向公众免费开放。
通义万相此次升级包括自研AI视频生成大模型的推出,该模型同时上线手机端和PC端,面向公众免费开放。平台具有文生视频和图生视频两个创作入口,支持一键生成音画同步视频。
关键观点2: 通义万相对中式元素针对性优化,实测表现出色。
通义万相在生成古风人物和风景方面的表现惊艳,理解提示词中的古风词汇,生成的视频具有中国味,自动配上的音效与画面高度契合。
关键观点3: 通义万相存在人物不一致、动作奇怪等问题。
实测中发现,通义万相生成的人物运动不符合物理规则,存在人物不一致、动作奇怪等问题。此外,生成视频的速度较慢,音效生成方面也存在一些不足。
关键观点4: 通义万相致力于降低普通用户的使用门槛。
通义万相通过产品层面的设计,致力于降低普通用户的使用门槛。如提供热门创意、灵感扩写等功能,方便用户轻松制作视频。
关键观点5: 国内多家大厂在AI视频生成领域有所布局。
国内已有多家大厂在AI视频生成领域有所布局并推出了相关产品,如快手、字节跳动、百度和腾讯等。通义万相的加入使得竞争更加激烈。
文章预览
作者 | 左卡 石濑 编辑 | 张洁 阿里终于杀入AI视频生成赛道! 9月19日云栖大会上,阿里CTO周靖人宣布通义万相全面升级。其中最大的亮点之一便是 通义万相全自研AI视频生成大模型同时上线手机端和PC端,并且面向公众免费开放。 不用排队、也不用到处借号了,直接登陆通义万相官网或下载通义App即可体验。 (相关链接已同步至文末) 颇有诚意的是,相比其他模型发布“先占位后迭代”的思路,阿里这次还 一次性放出了两个创作入口:文生视频和图生视频。 看来是憋了个大的。 据官方介绍,通义万相AI目前能够 一键生成最长5秒、每秒30帧、720P分辨率的音画同步视频 ,并且在核心架构Diffusion+Transformer的加持下, 支持复杂与大幅度运动生成,对中式元素针对性优化了概念理解和生成能力 ,被第一波实测的网友和媒体誉为“更
………………………………