专栏名称: AIGC开放社区

专注AIGC（生成式人工智能）领域的专业社区，关注GPT-4、百度文心一言、华为盘古等大语言模型（LLM）的发展应用和落地，以及国内LLM的发展和市场研究，社区秉承共建、共享、开放的理念，提供对社区会员有价值的商业化思路和服务。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

阿里发布轨迹可控的DiT视频生成模型—Tora

AIGC开放社区 · 公众号 · · 2024-08-10 08:21

文章预览

专注AIGC领域的专业社区，关注微软、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！视频生成模型最近取得了显著进展，例如，OpenAI 的 Sora 和国内的Vidu、可灵等模型，通过利用 Diffusion Transformer 的扩展特性，不仅能够满足各种分辨率、尺寸和时长的预测要求，同时生成的视频更符合物理世界的表现。视频生成技术需要在一系列图像中创造一致的运动，这凸显了运动控制的重要性。当前已有一些优秀的方法如 DragNUWA 和 MotionCtrl 已经实现了轨迹可控的视频生成，但这些方法受限于传统 U-Net 去噪模型，大多只能生成 16 帧长度、固定低分辨率的视频，难以应对长距离轨迹。此外，如果轨迹过于不规则或存在偏移过大等情况，这些方法十分容易出现运动模糊、外观失真和不自然的运动 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

培哥有话说 · 公司年会不堪入目节目一览

7 小时前

人生研究所 · 被安可拉红耳环惊艳住了！不到一杯奶茶钱，超显白谁戴都好看！

昨天

中水电 · 几内亚有限责任公司举办苏阿皮蒂水电站开放日活动

昨天

善意取得是你老舅 · 【25客观】可撤销之重大误解是什么？

2 天前

善意取得是你老舅 · 【25客观】可撤销之重大误解是什么？

2 天前

人生研究所 · 我为什么不回你微信了？

4 天前

丁香园肿瘤时间 · 靶免联合方案为晚期肝癌患者的一线治疗带来新选择

5 月前

育学园 · 通便第一名，不是香蕉而是它！建议孩子多吃，补水防便秘

3 周前

福建纪检监察 · 爱廉说•福来福往丨凌波清风绽芳华

1 周前