文章预览
Z Highlights 2023年是AI视频生成的爆发之年,各种技术路线不断涌现,推动视频生成从实验阶段迈向实用化。2024年, OpenAI推出的Sora模型以其创新的DiT(Diffusion Transformer)架构引领行业发展,推动技术逐步走向成熟。 随后,快手的Kling AI展示了生成两分钟长视频的能力,Minimax的海螺则实现了高清视频生成,进一步提升了行业标准。这些突破不仅加速了视频生成技术的进步,也为其商业化落地奠定了坚实的基础。 OpenAI Sora由一个仅15人的核心团队打造,核心负责人Bill Peebles在伯克利获得博士学位,师从计算机视觉专家Alyosha Efros。 博士期间,他在Meta实习半年,与谢赛宁合作发表了结合Transformer与扩散模型的DiT架构论文。 Transformer的优势在于其可扩展性,不仅继承了在语言领域的扩展规律,也让Sora从大量数据中学习复杂视频关系,建立视觉领域的扩展体系
………………………………