专栏名称: OpenCV学堂
一个致力于计算机视觉OpenCV原创技术传播的公众号!OpenCV计算机视觉与tensorflow深度学习相关算法原创文章分享、函数使用技巧、源码分析与讨论、,计算机视觉前沿技术介绍,技术专家经验分享,人才交流,学习交流。
今天看啥  ›  专栏  ›  OpenCV学堂

数字人新高度 | 霉霉开口唱碧昂丝的歌,又是AI!口型不出戏,五官姿态也自然,

OpenCV学堂  · 公众号  ·  · 2024-06-19 08:38
    

文章预览

点击上方 ↑↑↑ “ OpenCV学堂 ”关注我 来源:公众号  量子位   授权 一张人像、一段音频参考,就能让霉霉在你面前唱碧昂丝的《Halo》。 一种名为 Hallo 的研究火了,GitHub已揽星1k+。 话不多说,来看更多效果: 不论是说话还是唱歌,都能和各种风格的人像相匹配。从口型到眉毛眼睛动作,各种五官细节都很自然。 单独拎出不同动作强度的比较,动作幅度大也能驾驭: 单独调整嘴唇运动幅度,表现是这样婶儿的: 有不少网友看过效果后,直呼这是目前最好的开源口型同步视频生成: 这项工作由来自复旦大学、百度、苏黎世联邦理工学院和南京大学的研究人员共同完成。 团队提出了 分层的音频驱动视觉合成模块 ,将人脸划分为嘴唇、表情和姿态三个区域,分别学习它们与音频的对齐关系,再通过自适应加权将这三个注意力模块的输出融合在一 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览