专栏名称: AIWalker

关注计算机视觉、图像处理、深度学习等领域的干货分享与前沿paper解读。AIWalker由具有多年算法研究与产品化落地经验的Happy运营，原创为主、同时会转载优秀解读文章。欢迎志同道合的小伙伴们加入一同学习进步。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

像俄罗斯方块一样生成视频！北大联合快手AI团队推出新框架VideoTetris实现跟随复杂指令的文生视频！

AIWalker · 公众号 · · 2024-06-12 22:00

文章预览

关注「 AIWalker 」并星标从此AI不迷路作者：Ye Tian、 Ling Yang等解读： AI生成未来 Paper: https://arxiv.org/abs/2406.04277 Code: https://github.com/YangLing0818/VideoTetris Project: https://videotetris.github.io/ 扩散模型在文本到视频（T2V）生成方面取得了巨大成功，视频生成模型正以飞快的速度发展。然而，现有的文生视频模型在应对复杂、细节丰富、多物体的指令时，仍存在一定的挑战。为了生成更精确的复杂视频，北京大学与快手AI团队推出了 VideoTetris ，定义了复杂组合指令生成任务，并提出了一个新的框架，实现复杂视频生成。这个框架不仅能够直接增强现有模型的组合生成，还能够支持涵盖多复杂指令、多场景变更等更高难度的长视频生成。具体而言，提出了时空合成扩散，通过在空间和时间上操纵和合成去噪网络的注意力图来 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博