实时交互流式数字人

GitHubStore · 公众号 · · 2024-07-29 16:32

文章预览

项目简介实时交互流式数字人，实现音视频同步对话。基本可以达到商用效果特点支持多种数字人模型: ernerf、musetalk、wav2lip 支持声音克隆支持数字人说话被打断支持全身视频拼接支持rtmp和webrtc 支持视频编排：不说话时播放自定义视频安装安装依赖 conda create -n nerfstream python=3.10 conda activate nerfstream conda install pytorch==1.12.1 torchvision==0.13.1 cudatoolkit=11.3 -c pytorch pip install -r requirements.txt #如果只用musetalk或者wav2lip模型，不需要安装下面的库 pip install "git+https://github.com/facebookresearch/pytorch3d.git" pip install tensorflow-gpu==2.8.0 pip install --upgrade "protobuf < =3.20.1" linux cuda环境搭建可以参考这篇文章 https://zhuanlan.zhihu.com/p/674972886 2. Quick Start 默认采用ernerf模型，webrtc推流到srs 2.1 运行srs export CANDIDATE='' docker run --rm --env CANDIDATE=$CANDIDATE \ -p 1935:1935 -p 8080:8080 -p 1985:1985 -p ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

科幻世界SFW · 中国航天日 | 空间科学与试验如何创新突破？这场研讨会给你最新思路！

昨天

广西师乐 · 广西教师招聘考试历年高频知识点汇总！上岸必备！

9 月前

科学材料站 · 科学材料站：电催化ECO2RR测试+原位红外/拉曼测试（自研H池、流动池、膜电极、CO2-甲酸池、膜电极电堆）

6 月前

都市频道 · 降价了！300多万人将受益

2 月前

上海发布 · 明早气温较低，郊区零下1度到1度！下周上半周冬天，下半周春天

1 月前