文章预览
“ MovieDreamer: Hierarchical Generation for Coherent Long Visual Sequences ” Sora的出现标志着AI视频生成领域得到了突破性的进展,但是Sora只能生成1分钟左右的短视频。为了突破AI视频生成时长,阿里的研究人员发表了MovieDreamer。 MovieDreamer结合自回归建模和扩散渲染,实现了长视频生成。通过层次化方法,保证了视觉故事中的长期连贯性和短期保真度。展示了卓越的生成质量,具有详细的视觉连续性、高保真度的视觉细节以及角色身份保持能力。 项目主页:https://aim-uofa.github.io/MovieDreamer/ 论文地址 :https://arxiv.org/pdf/2407.16655 Github地址 :https://github.com/aim-uofa/MovieDreamer 摘要 MovieDreamer是一种新的层次结构框架,将自回归模型与扩散渲染相结合,用于长时间视频生成。该方法利用自回归模型进行全局叙事连贯性,通过扩散渲染将视觉令牌序列转换为高质量视频帧。此
………………………………