专栏名称: AI真好玩
分享前沿AI资讯,带你玩转各类AI工具,掌控数字未来!
今天看啥  ›  专栏  ›  AI真好玩

开源流式数字人来了:实现音视频同步对话,基本可达商用效果!

AI真好玩  · 公众号  ·  · 2024-06-02 20:17
    

文章预览

Vach [1]  是一个开源的流式数字人项目,实现音视频同步对话,基本可以达到商用效果。 近期热文 当 AI 遇上爬虫:让数据提取变得前所未有的简单! 超强 OCR 新秀:支持 90 多种语言,性能超越云服务! 7.8K Star RAG 引擎:基于深度文档理解,最大程度降低幻觉、无限上下文快速完成 “大海捞针” 测试! Vach 核心功能 支持文本/语音交互(✅) 支持 SyncTalk [2]  项目(✅) 声音克隆(开发中) 直播间业务 (开发中) 展示屏互动 (开发中) Vach 快速上手 1.克隆项目 git clonehttps://github.com/Hujiazeng/Vach.git cd Vach 2.安装项目依赖 conda create -n Vach python==3.10 conda activate Vach pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113 pip install -r requirements.txt pip install --no-index --no-cache-dir pytorch3d -f https://dl. ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览