专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
今天看啥  ›  专栏  ›  歸藏的AI工具箱

复旦发布了一个开源版本的 EMO。#ai视频# 通过输入音频让面-20240616014102

歸藏的AI工具箱  · 微博  ·  · 2024-06-16 01:41
    

文章预览

2024-06-16 01:41 本条微博链接 复旦发布了一个开源版本的 EMO。 #ai视频# 通过输入音频让面部照片开始说话,并且有对于的表情。看起来效果很自然。 采用端到端的扩散范式,引入了分层的音频驱动视觉合成模块,以提高音频输入与视觉输出之间的对齐精度,包括唇部、表情和姿势的运动。 分层音频驱动的视觉合成模块提供了对表情和姿势多样性的自适应控制,更有效地实现了针对不同身份的个性化定制。 项目地址: 网 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览