寥寥数笔，动画自成！阿里Tora: 首个轨迹引导的DiT创新实现精确运动控制视频生成

AI生成未来 · 公众号 · · 2024-08-02 00:30

文章预览

点击下方卡片，关注“ AI生成未来 ” >>后台回复“GAI”，免费获取AI行业报告和资料！作者：Zhenghao Zhang等解读：AI生成未来论文链接：https://arxiv.org/pdf/2407.21705 项目链接：https://ali-videoai.github.io/tora_video/ 亮点直击本文引入了Tora，这是第一个轨迹导向的DiT用于视频生成。如下图2所示，Tora无缝整合了广泛的视觉和轨迹指令，从而能够熟练地创建可操控运动的视频。为了与DiT的可扩展性保持一致，本文设计了一种新颖的轨迹提取器和运动引导融合机制，以获取时空运动块，随后将这些块注入DiT块中。本文对几种架构选择进行了消融实验，并为未来基于DiT的运动控制研究提供了实证基线。实验表明，Tora能够生成具有不同纵横比的720p分辨率视频，最长可达204帧，所有这些都由指定的轨迹引导。此外，它在模拟物理世界中的运动方面 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

三峡小微 · 新疆皮山学子获三峡集团助学金

3 天前

三峡小微 · 三峡集团一组获奖快讯

3 天前

三峡小微 · 认识更好的大坝丨“大坝安全需要多方持续投入”

4 天前

三峡小微 · 媒体聚焦：海上风电共链大会、设备智能化升级、三峡工程综合效益拓展

5 天前

三峡小微 · 认识更好的大坝丨保障水电站大坝安全运行

1 周前

医脉通临床指南 · 论文发表骗局大揭秘：教你如何识别和防范

3 月前

鲤Newriting · 上海活动丨张悦然×黄昱宁×毛尖：欢迎来到天鹅旅馆

2 月前