专栏名称: Z Potentials
我们与Z Potentials同频共振
目录
相关文章推荐
今天看啥  ›  专栏  ›  Z Potentials

Z Research|视频生成大爆发:技术路线收敛,中国团队后发而先至,快手可灵和Minimax赶超Sora

Z Potentials  · 公众号  ·  · 2024-10-18 13:00
    

文章预览

Z Highlights 2023年是AI视频生成的爆发之年,各种技术路线不断涌现,推动视频生成从实验阶段迈向实用化。2024年, OpenAI推出的Sora模型以其创新的DiT(Diffusion Transformer)架构引领行业发展,推动技术逐步走向成熟。 随后,快手的Kling AI展示了生成两分钟长视频的能力,Minimax的海螺则实现了高清视频生成,进一步提升了行业标准。这些突破不仅加速了视频生成技术的进步,也为其商业化落地奠定了坚实的基础。 OpenAI Sora由一个仅15人的核心团队打造,核心负责人Bill Peebles在伯克利获得博士学位,师从计算机视觉专家Alyosha Efros。 博士期间,他在Meta实习半年,与谢赛宁合作发表了结合Transformer与扩散模型的DiT架构论文。 Transformer的优势在于其可扩展性,不仅继承了在语言领域的扩展规律,也让Sora从大量数据中学习复杂视频关系,建立视觉领域的扩展体系 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览