注册
登录
专栏名称:
中国人工智能学会
关注中国人工智能学会官方公共账号,收取学会的科普信息、新闻动态、活动预告及人工智能领域科技前沿信息。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
通俗版解读 查看图片-20250108060850
·
昨天
爱可可-爱生活
·
【Awesome-MLSys-Blogger ...
·
2 天前
宝玉xp
·
新手 Cursor ...
·
2 天前
宝玉xp
·
VITA-1.5:VITA-1.5 ...
·
2 天前
爱可可-爱生活
·
【机器人学习课程:CS ...
·
3 天前
今天看啥
›
专栏
›
中国人工智能学会
前沿分享丨霉霉开口唱碧昂丝的歌,又是AI!口型不出戏,五官姿态也自然,复旦百度等出品
中国人工智能学会
·
公众号
·
AI
· 2024-06-21 17:24
文章预览
转自 量子位 西风 发自 凹非寺 量子位 | 公众号 QbitAI 一张人像、一段音频参考,就能让霉霉在你面前唱碧昂丝的《Halo》。 一种名为 Hallo 的研究火了,GitHub已揽星1k+。 话不多说,来看更多效果: 不论是说话还是唱歌,都能和各种风格的人像相匹配。从口型到眉毛眼睛动作,各种五官细节都很自然。 单独拎出不同动作强度的比较,动作幅度大也能驾驭: 单独调整嘴唇运动幅度,表现是这样婶儿的: 有不少网友看过效果后,直呼这是目前最好的开源口型同步视频生成: 这项工作由来自复旦大学、百度、苏黎世联邦理工学院和南京大学的研究人员共同完成。 团队提出了 分层的音频驱动视觉合成模块 ,将人脸划分为嘴唇、表情和姿态三个区域,分别学习它们与音频的对齐关系,再通过自适应加权将这三个注意力模块的输出融合在一起,由此可以更 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
爱可可-爱生活
·
通俗版解读 查看图片-20250108060850
昨天
爱可可-爱生活
·
【Awesome-MLSys-Blogger:机器学习系统领域优-20250107182106
2 天前
宝玉xp
·
新手 Cursor 用户:给我写一个博客系统Cursor:一个简-20250107040207
2 天前
宝玉xp
·
VITA-1.5:VITA-1.5 是一款类似于 GPT-4o -20250107021013
2 天前
爱可可-爱生活
·
【机器人学习课程:CS 294-277,机器人学习(秋季 202-20250106174703
3 天前
NAI500
·
中国放大招,美股矿业和金属股票创出2024年以来的最大单日涨幅
3 月前