专栏名称: GitHubStore
分享有意思的开源项目
目录
相关文章推荐
今天看啥  ›  专栏  ›  GitHubStore

完全本地化的AI语音聊天工具

GitHubStore  · 公众号  ·  · 2024-08-06 16:22

文章预览

项目简介 一款快速、完全本地化的AI语音聊天工具,使用WebSockets实现低延迟语音交互,支持多种语音识别和合成技术 在 7900 类 AMD RDNA3 显卡上,语音到语音的延迟在 1 秒范围内: Whisper large-v2 (Q5) Llama 3 8B (Q4_K_M) tts_models/en/vctk/vits (Coqui TTS default VITS models) 在 4090 上,使用更快的 Whisper(faster-distil-whisper-large-v2),我们可以将延迟降低到低至 300 毫秒: 安装 这些安装指南适用于 Ubuntu LTS,并假设您已经设置了 ROCm 或 CUDA。 我建议你使用 conda 或(我更喜欢的)mamba 进行环境管理。这会让你的生活更轻松。 系统先决条件 sudo apt update # Not strictly required but the helpers we use sudo apt install byobu curl wget # Audio processing sudo apt install espeak-ng ffmpeg libopus0 libopus-dev Checkout code # Create env mamba create -y -n voicechat2 python=3.11 # Setup mamba activate voicechat2 git clone https://github.com/lh ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览