文章预览
这篇报告来自快手版 sora 可灵文生视频大模型背后的算法大佬王鑫涛的在视觉与学习青年学者研讨会的公开分享 图像生成到视频生成"路线之争": 介绍了图像生成技术的不同技术路线, 对整体的发展有一个了解。 包括GAN(生成对抗网络)到Diffusion(扩散模型)的转变,以及它们在生成质量和训练稳定性方面的特点。 视频生成技术探索 :探讨了视频生成的基本概念,包括前Sora时代和后Sora时代的技术发展,以及视频生成与物理世界的联系。 Mini-Sora (Mira) 的初步研究 :讨论了对Sora模型的理解和Mini-Sora(Mira)的探索,包括视频生成的挑战、训练策略和结果。 可控、编辑与应用 :基于视频生成基础模型,探讨了可控性、编辑能力和应用场景,包括空间控制、概念控制、风格控制和运动控制等。 研究经验总结-HandyEXP :总结了在视频生成领域的研究经
………………………………