文章预览
目前已经有很多面部和唇形同步的数字人项目了,但大多只支持头像和上半身,前几天介绍的Hallo2音频驱动图像生成视频小伙伴们都非常关心,后台也有留言问有没有支持全身视频生成的方法。 开源EMO再升级!复旦|百度|南大推出Hallo2:可以生成4K,一小时的音频驱动的视频。 今天给大家介绍的是由东京大学和 CyberAgent AI Lab 共同研发的项目TANGO,它能根据目标语音音频生成同步全身手势的视频。只需提供一段肢体动作视频和目标语音音频,TANGO就能将两者合成制作出高保真度、动作同步的视频。 相关链接 项目地址:https://pantomatrix.github.io/TANGO/ 使用地址:huggingface.co/spaces/H-Liu1997/TANGO 代码地址:https://github.com/CyberAgentAILab/TANGO 论文介绍 TANGO 是一个框架,旨在使用基于运动图的检索方法生成同步语音身体姿势视频。它首先利用隐式分层音频运动嵌
………………………………