前沿分享丨霉霉开口唱碧昂丝的歌，又是AI！口型不出戏，五官姿态也自然，复旦百度等出品

中国人工智能学会 · 公众号 · AI · 2024-06-21 17:24

文章预览

转自量子位西风发自凹非寺量子位 | 公众号 QbitAI 一张人像、一段音频参考，就能让霉霉在你面前唱碧昂丝的《Halo》。一种名为 Hallo 的研究火了，GitHub已揽星1k+。话不多说，来看更多效果：不论是说话还是唱歌，都能和各种风格的人像相匹配。从口型到眉毛眼睛动作，各种五官细节都很自然。单独拎出不同动作强度的比较，动作幅度大也能驾驭：单独调整嘴唇运动幅度，表现是这样婶儿的：有不少网友看过效果后，直呼这是目前最好的开源口型同步视频生成：这项工作由来自复旦大学、百度、苏黎世联邦理工学院和南京大学的研究人员共同完成。团队提出了分层的音频驱动视觉合成模块，将人脸划分为嘴唇、表情和姿态三个区域，分别学习它们与音频的对齐关系，再通过自适应加权将这三个注意力模块的输出融合在一起，由此可以更 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 通俗版解读查看图片-20250108060850

昨天

爱可可-爱生活 · 【Awesome-MLSys-Blogger：机器学习系统领域优-20250107182106

2 天前

宝玉xp · 新手 Cursor 用户：给我写一个博客系统Cursor：一个简-20250107040207

2 天前

宝玉xp · VITA-1.5：VITA-1.5 是一款类似于 GPT-4o -20250107021013

2 天前

爱可可-爱生活 · 【机器人学习课程：CS 294-277，机器人学习（秋季 202-20250106174703

3 天前

NAI500 · 中国放大招，美股矿业和金属股票创出2024年以来的最大单日涨幅

3 月前