商汤发布UniTalker：实现高质量音频驱动3D面部动画生成

3D视觉之心 · 公众号 · · 2024-09-24 07:00

文章预览

作者 | AIGC Studio 编辑 | AIGC Studio 点击下方卡片，关注“ 3D视觉之心 ”公众号第一时间获取 3D视觉干货 >> 点击进入→ 3D视觉之心技术交流群商汤研究院最新发布了一个先进的3D面部动画系统UniTalker，可以从不同的音频领域生成逼真的面部动作，包括各种语言的清晰和嘈杂的声音、文本到语音生成的音频，甚至伴有背景音乐的嘈杂歌曲。 UniTalker 可以输出多个注释。对于具有新注释的数据集，可以简单地将新的头插入 UniTalker 并使用现有数据集或仅使用新数据集进行训练，从而避免重新拓扑。效果如下：相关链接代码链接：https://github.com/X-niper/UniTalker 论文链接：https://arxiv.org/pdf/2408.00762 项目地址：https://x-niper.github.io/projects/UniTalker/ 论文阅读 UniTalker：通过统一模型扩展音频驱动的 3D 面部动画摘要音频驱动的 3D 面部动画旨在将输入音频映射到逼 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博