Smol TTS 模型来了！OuteTTS-0.1-350M --20241105062852

斌叔OKmath · 微博 · · 2024-11-05 06:28

文章预览

2024-11-05 06:28 本条微博链接 Smol TTS 模型来了！OuteTTS-0.1-350M - 零样本语音克隆，基于 LLaMa 架构构建，CC-BY 许可！🔥 纯语言建模方法实现 TTS 零样本语音克隆带音频标记的 LLaMa 架构（WavTokenizer）奖励：使用 llama.cpp 在设备上工作⚡ TTS 的三步方法：使用 WavTokenizer 进行音频标记化（每秒 75 tok） CTC 强制对齐以进行单词到音频标记映射带转录、持续时间、音频标记的结构化提示创建该模型对于 3.5 亿个参数来说非常令 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

仙桃电视台 · “仙马”新增至15个安全岛！市民过马路攻略速戳→

3 天前

仙桃电视台 · “仙马”新增至15个安全岛！市民过马路攻略速戳→

3 天前

哈尔滨市第四医院 · 【科技周】弘扬科学家精神激发全社会创新活力 | 哈尔滨市第四医院举办科技周活动

10 月前

城市数据派 · 【开课倒计时3天】手把手写代码，通过丰富实例掌握城市计算前沿方法丨城市数据派

8 月前

心在线 · 精彩病例丨CDQI名家面对面第204期：预激综合征射频消融术后心脏骤停一例

3 月前