文章预览
老胡的信息周刊 [1] ,记录这周我看到的有价值的信息,主要针对计算机领域,内容主题极大程度被我个人喜好主导。这个项目核心目的在于记录让自己有印象的信息做一个 留存 以及 共享 。 🎯 项目 ChatTTS [2] ChatTTS 是专门为对话场景设计的文本转语音模型,例如 LLM 助手对话任务,它支持英文和中文两种语言,最大的模型使用了 10 万小时以上的中英文数据进行训练: 对话式 TTS: ChatTTS 针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。 更好的韵律: ChatTTS 在韵律方面超越了大部分开源 TTS 模型。同时提供预训练模型,支持进一步的研究。 效果挺好的,相关 Web UI 有 ChatTTS-ui [3] 项目: ChatTTS Gallery-Portfolio [4] 一个简单的摄影作品展示
………………………………