今天看啥  ›  专栏  ›  Ai秦始皇

(AI启动器)ChatTTS:炸裂!堪比真人的AI语音、多情感语音

Ai秦始皇  · 公众号  ·  · 2024-05-31 07:00
    

文章预览

ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小时训练且未SFT的版本。 项目主页: https://github.com/2noise/ChatTTS 星星Star: 7.9K+ ( 4万小时模型已开源, 10万小时的模型未开放,应该要收费 ) 效果演示 (逼真的对话式多情感语音对话体验) (作者实测) 项目简介 一款 使用了10万小时真人对话场景数据训练的多情感语音模型。 亮点 对话式 TTS : ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。 细粒度控制 : 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。 更好的韵律 : ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览