注册
登录
专栏名称:
量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
人工智能那点事
·
悲催!宁波小米SU7销售带客户试驾,在红绿灯 ...
·
昨天
爱可可-爱生活
·
【Semi-Auto-NovelAI-to- ...
·
2 天前
爱可可-爱生活
·
【ACU - Awesome Agents ...
·
2 天前
爱可可-爱生活
·
[LG]《Aviary: training ...
·
3 天前
黄建同学
·
41岁DeepMind天才科学家Felix ...
·
4 天前
今天看啥
›
专栏
›
量子位
霉霉开口唱碧昂丝的歌,又是AI!口型不出戏,五官姿态也自然,复旦百度等出品|GitHub揽星1k+
量子位
·
公众号
·
AI
· 2024-06-17 17:19
文章预览
西风 发自 凹非寺 量子位 | 公众号 QbitAI 一张人像、一段音频参考,就能让霉霉在你面前唱碧昂丝的《Halo》。 一种名为 Hallo 的研究火了,GitHub已揽星1k+。 话不多说,来看更多效果: 不论是说话还是唱歌,都能和各种风格的人像相匹配。从口型到眉毛眼睛动作,各种五官细节都很自然。 单独拎出不同动作强度的比较,动作幅度大也能驾驭: 单独调整嘴唇运动幅度,表现是这样婶儿的: 有不少网友看过效果后,直呼这是目前最好的开源口型同步视频生成: 这项工作由来自复旦大学、百度、苏黎世联邦理工学院和南京大学的研究人员共同完成。 团队提出了 分层的音频驱动视觉合成模块 ,将人脸划分为嘴唇、表情和姿态三个区域,分别学习它们与音频的对齐关系,再通过自适应加权将这三个注意力模块的输出融合在一起,由此可以更精细地建模音 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
人工智能那点事
·
悲催!宁波小米SU7销售带客户试驾,在红绿灯弹射起步把人撞飞了
昨天
爱可可-爱生活
·
【Semi-Auto-NovelAI-to-Pixiv:集成了多-20250106133356
2 天前
爱可可-爱生活
·
【ACU - Awesome Agents for Comput-20250106135257
2 天前
爱可可-爱生活
·
[LG]《Aviary: training language a-20250105055331
3 天前
黄建同学
·
41岁DeepMind天才科学家Felix Hill生前写的一篇-20250104120557
4 天前
钙钛矿太阳能电池
·
山东大学李培洲&于伟泳最新AM:坚固的咪唑连接共价有机框架可实现结晶调节和体缺陷钝化,从而实现高效稳定的钙钛矿太阳能电池
4 月前
春城晚报
·
立即进入应急响应状态!台风“摩羯”明起影响云南!
4 月前
北美留学生观察
·
牛津宣布:短视频刷多了真的会变笨!
2 周前