文章预览
最近的AI视频又开始热闹起来了,在Sora发布四个月后,大家并没有等到Sora,但是Sora背后的技术框架DiT( Diffusion Transformers)开始被广泛应用。并且有逐渐成为主流的趋势。 一开始是快手发布了可灵,第一个最接近Sora的文生视频大模型。 然后是Luma发布了他们的 Dream Machine视频模型,并且成为第一个可以使用文生视频的DiT架构的AI视频工具。 我很奇怪,Runway这段时间过于安静了,一定是在憋大招。果不其然,它终于发布了Gen-3 Alpha,从案例上看很明显用的是DiT的技术。 官方宣传页面上也提到了世界大模型。我们没有等来Sora,但是等来了世界大模型的全面开花,Openai一直以来都在给大家指明技术方向。 无论是可灵,luma还是这一次的Gen-3,在视频的真实性,连贯性上都得到了大幅的提升,并且这次的Runway发布的Gen-3,之前一系列可控性的功能将会全部应用
………………………………