文章预览
在之前的文章中已经给大家介绍过蚂蚁集团的开源数字人项目EchoMimic,感兴趣的小伙伴可以点击下面链接阅读~ 蚂蚁集团放大招!EchoMimic来袭,音频+面部标志,让你的肖像“活”起来,直呼效果逼真! 现在EchoMimic升级到V2版本了,V1仅是用图片和音频生成数字脸,V2就是真正的数字人了。一张半身照片,配上中文或英语音频,就能生成带手势的数字人视频。 EchoMimicV2利用参考图像、音频片段和一系列手部姿势来生成高质量的动画视频,确保音频内容和半身动作之间的连贯性。 unset unset 相关链接 unset unset 论文:https://arxiv.org/pdf/2411.10061 代码:https://github.com/antgroup/echomimic_v2 模型:https://huggingface.co/BadToBest/EchoMimicV2 主页:https://antgroup.github.io/ai/echomimic_v2 unset unset 论文介绍 unset unset 近期关于人体动画的研究通常涉及音频、姿势或运动图条件,从而实现逼
………………………………