霉霉开口唱碧昂丝的歌，又是AI！口型不出戏，五官姿态也自然，复旦百度等出品｜GitHub揽星1k+

量子位 · 公众号 · AI · 2024-06-17 17:19

文章预览

西风发自凹非寺量子位 | 公众号 QbitAI 一张人像、一段音频参考，就能让霉霉在你面前唱碧昂丝的《Halo》。一种名为 Hallo 的研究火了，GitHub已揽星1k+。话不多说，来看更多效果：不论是说话还是唱歌，都能和各种风格的人像相匹配。从口型到眉毛眼睛动作，各种五官细节都很自然。单独拎出不同动作强度的比较，动作幅度大也能驾驭：单独调整嘴唇运动幅度，表现是这样婶儿的：有不少网友看过效果后，直呼这是目前最好的开源口型同步视频生成：这项工作由来自复旦大学、百度、苏黎世联邦理工学院和南京大学的研究人员共同完成。团队提出了分层的音频驱动视觉合成模块，将人脸划分为嘴唇、表情和姿态三个区域，分别学习它们与音频的对齐关系，再通过自适应加权将这三个注意力模块的输出融合在一起，由此可以更精细地建模音 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

人工智能那点事 · 悲催！宁波小米SU7销售带客户试驾，在红绿灯弹射起步把人撞飞了

昨天

爱可可-爱生活 · 【Semi-Auto-NovelAI-to-Pixiv：集成了多-20250106133356

2 天前

爱可可-爱生活 · 【ACU - Awesome Agents for Comput-20250106135257

2 天前

爱可可-爱生活 · [LG]《Aviary: training language a-20250105055331

3 天前

黄建同学 · 41岁DeepMind天才科学家Felix Hill生前写的一篇-20250104120557

4 天前

钙钛矿太阳能电池 · 山东大学李培洲&于伟泳最新AM：坚固的咪唑连接共价有机框架可实现结晶调节和体缺陷钝化，从而实现高效稳定的钙钛矿太阳能电池

4 月前

春城晚报 · 立即进入应急响应状态！台风“摩羯”明起影响云南！

4 月前

北美留学生观察 · 牛津宣布：短视频刷多了真的会变笨！

2 周前