专栏名称: Founder Park
来自极客公园,专注与科技创业者聊「真问题」。
今天看啥  ›  专栏  ›  Founder Park

视频生成产品 PixVerse 版本大更新!支持一键生成5段、最长 40S 连续视频

Founder Park  · 公众号  ·  · 2024-07-24 20:03

文章预览

今年6 月份起,视频生成赛道持续涌现新的产品,从可灵到 Luma、Runway Gen3,模型能力和产品化效果越来越卷。 7 月 24 日,爱诗科技正式发布视频生成产品 PixVerse V2。 新版本产品采用 Diffusion+Transformer(DiT)基础架构,提升了模型能力。 PixVerse V2 这次上线将提供给全球用户使用,它能够在保证风格一致性前提下,快速制作出 多个 8 秒的短视频片段 ,还可以实现 长达 40 秒的视频 。 01  采用 DiT 架构 多个技术创新 PixVerse V2 采用了行业领先的 DiT 模型架构,通过模型训练,实现了视频大模型的 Scaling Law。 在多个技术层面,PixVerse V2 也采用了独创的创新技术。 第一点,在 Diffusion 时空建模方面。 爱诗独创了一种时空注意力建模机制,且是「更合理的」,它优于时空分离以及 fullseq 架构 。 这种机制对时间、空间的感知力都更好,对复杂场景的处理也更好 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览