专栏名称: AIGC Studio
一个有趣有AI的AIGC公众号:关注AI、深度学习、计算机视觉、AIGC、Stable Diffusion、Sora等相关技术。这里不仅有简单易懂的AIGC理论实践和AI学习路线,还有大厂工作经历和体会分享。如果有幸能给你一些帮助就更好啦!
今天看啥  ›  专栏  ›  AIGC Studio

开源EMO再升级!复旦|百度|南大推出Hallo2:可以生成4K,一小时的音频驱动的视频。

AIGC Studio  · 公众号  ·  · 2024-10-17 07:11

文章预览

在之前的文章中已经和大家介绍过复旦大学开源的Hallo项目,感兴趣的小伙伴可以点击以下链接阅读~ 复旦发布开源版本的EMO,只需输入一段音频和一张照片就可以让人物开始说话。 复旦开源版本EMO:真实人物效果 复旦开源版本EMO:运动控制效果 今天给大家介绍Hallo的升级版本Hallo2,该方法处理单个参考图像以及持续几分钟的音频输入。此外,可以以不同的间隔引入可选的文本提示,以调节和细化肖像的表情。最终输出的是高分辨率 4K 视频,该视频与音频同步,并受可选表情提示的影响,确保整个视频的连续性。 相关链接 论文地址:http://arxiv.org/abs/2410.07718v1 项目主页:https://fudan-generative-vision.github.io/hallo2 代码地址:https://github.com/fudan-generative-vision/hallo2 试用地址:https://huggingface.co/fudan-generative-ai/hallo2 论文阅读 Hallo2:长时间、高分辨率音频驱动 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览