数字人动作视频生成资源库

GitHubStore · 公众号 · · 2024-10-17 08:31

文章预览

项目简介本项目认真总结了👍2D数字人动作视频生成👏相关领域的最新进展，包括论文、数据集和代码库。 Repo以 Vision-driven、Text-driven、Audio-driven 三大方向作以总结，同时考虑 LLM Planning 前沿论文。分类时，我们定义Audio>Text>Vision优先级，当出现文本不出现音频时，归纳为Text-Driven方法，当文本音频同时出现时，归纳为Audio-Driven方法，以此类推。区别于以往的总结，项目明确总结了数字人视频生成领域的五大阶段： 🌑 第1阶段明确驱动源（Vision、Text、Audio）与驱动区域（Part、Holistic），其中Part主要以脸部为主； 🌒 第2阶段动作规划阶段，大多数工作以特征Mapping学习动作映射，少部分工作以大语言模型LLMs进行动作规划； 🌓 第3阶段人体视频生成，大部分工作以Diffusion Models为基础，少部分工作以Transformer为基础； 🌔 第4阶段视频优化阶段，针 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

果壳 · 如果洗发水没有了，能用沐浴露洗头吗？

14 小时前

宇宙解码 · 为什么我们会看到“鬼”？科学家通过实验，证明了“鬼”的真相

昨天

果壳 · 无脑选中间就错了！看电影教你选最佳观影位

3 天前

果壳 · 不建议美甲的重要理由：可能会影响补牙！

3 天前

观察者网 · 胡塞武装在红海袭击两艘美国驱逐舰

8 月前

Kevin在纽约 · 韩国首尔第三日，想擦一下穿的白鞋，发现也没啥好擦的，我想起了日-20240604122903

8 月前

Financial小伙伴 · 老王都没有放弃复出，普通人还摆烂什么

4 月前

科技兽 · 微信春节数据报告出炉：这个省收发红包最多，南方人日均步数更高

1 周前