专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
今天看啥  ›  专栏  ›  黄建同学

MEMO:使用记忆引导扩散方法,基于音频生成富有表现力的说话肖像-20241223113411

黄建同学  · 微博  · AI  · 2024-12-23 11:34
    

文章预览

2024-12-23 11:34 本条微博链接 MEMO:使用记忆引导扩散方法,基于音频生成富有表现力的说话肖像视频 #ai创造营# #ai视频# 摘要: 视频扩散模型的最新进展为逼真的音频驱动的有声视频生成开辟了新的潜力。然而,在生成的有声视频中实现无缝的口型同步、保持长期身份一致性以及产生自然、与音频一致的表情仍然是重大挑战。 为了应对这些挑战,我们提出了记忆引导的EMO感知扩散 (MEMO),这是一种端到端的音频驱动肖像 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览