阿里终于杀入AI视频生成！一键直出音画同步国风视频，还能读懂中国古诗 | AI评测

AI新榜 · 公众号 · · 2024-09-20 19:06

主要观点总结

阿里巴巴的AI视频生成平台通义万相在云栖大会上宣布全面升级，推出自研的AI视频生成大模型，并面向公众免费开放。该平台具有文生视频和图生视频两个创作入口，支持一键生成音画同步视频，且针对中式元素进行优化。经过实测，通义万相在处理人物运动、音效生成、复杂语义理解等方面表现出色，但也存在一些问题，如人物不一致、动作奇怪等。与其他大厂AI视频生成产品相比，通义万相在移动端使用免费且致力于降低普通用户的使用门槛。

关键观点总结

关键观点1: 通义万相全面升级，推出自研AI视频生成大模型，并面向公众免费开放。

通义万相此次升级包括自研AI视频生成大模型的推出，该模型同时上线手机端和PC端，面向公众免费开放。平台具有文生视频和图生视频两个创作入口，支持一键生成音画同步视频。

关键观点2: 通义万相对中式元素针对性优化，实测表现出色。

通义万相在生成古风人物和风景方面的表现惊艳，理解提示词中的古风词汇，生成的视频具有中国味，自动配上的音效与画面高度契合。

关键观点3: 通义万相存在人物不一致、动作奇怪等问题。

实测中发现，通义万相生成的人物运动不符合物理规则，存在人物不一致、动作奇怪等问题。此外，生成视频的速度较慢，音效生成方面也存在一些不足。

关键观点4: 通义万相致力于降低普通用户的使用门槛。

通义万相通过产品层面的设计，致力于降低普通用户的使用门槛。如提供热门创意、灵感扩写等功能，方便用户轻松制作视频。

关键观点5: 国内多家大厂在AI视频生成领域有所布局。

国内已有多家大厂在AI视频生成领域有所布局并推出了相关产品，如快手、字节跳动、百度和腾讯等。通义万相的加入使得竞争更加激烈。

文章预览

作者 | 左卡石濑 ‍‍‍‍‍‍ 编辑 | 张洁 ‍‍ 阿里终于杀入AI视频生成赛道！ 9月19日云栖大会上，阿里CTO周靖人宣布通义万相全面升级。其中最大的亮点之一便是通义万相全自研AI视频生成大模型同时上线手机端和PC端，并且面向公众免费开放。不用排队、也不用到处借号了，直接登陆通义万相官网或下载通义App即可体验。（相关链接已同步至文末）颇有诚意的是，相比其他模型发布“先占位后迭代”的思路，阿里这次还一次性放出了两个创作入口：文生视频和图生视频。看来是憋了个大的。据官方介绍，通义万相AI目前能够一键生成最长5秒、每秒30帧、720P分辨率的音画同步视频，并且在核心架构Diffusion+Transformer的加持下，支持复杂与大幅度运动生成，对中式元素针对性优化了概念理解和生成能力，被第一波实测的网友和媒体誉为“更 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博