文章预览
今年6 月份起,视频生成赛道持续涌现新的产品,从可灵到 Luma、Runway Gen3,模型能力和产品化效果越来越卷。 7 月 24 日,爱诗科技正式发布视频生成产品 PixVerse V2。 新版本产品采用 Diffusion+Transformer(DiT)基础架构,提升了模型能力。 PixVerse V2 这次上线将提供给全球用户使用,它能够在保证风格一致性前提下,快速制作出 多个 8 秒的短视频片段 ,还可以实现 长达 40 秒的视频 。 01 采用 DiT 架构 多个技术创新 PixVerse V2 采用了行业领先的 DiT 模型架构,通过模型训练,实现了视频大模型的 Scaling Law。 在多个技术层面,PixVerse V2 也采用了独创的创新技术。 第一点,在 Diffusion 时空建模方面。 爱诗独创了一种时空注意力建模机制,且是「更合理的」,它优于时空分离以及 fullseq 架构 。 这种机制对时间、空间的感知力都更好,对复杂场景的处理也更好
………………………………