文章预览
2024-10-13 16:09
本条微博链接
上海交通大学开源了一个非常牛批的语音生成模型 F5-TTS。 #ai# 刚好这几天AI音频和播客火爆,这下瞌睡送枕头了。 模型特点有: 零样本 (Zero-shot) 声音克隆 速度控制(基于总时长) 可以控制合成语音的情感表现 长文本合成 支持中文和英文多语言合成 在 10 万小时数据上训练 最重要的是支持商用 论文: 网页链接 模型下载: 网页链接 演示Demo: 网页链接 项目地址: 网页链接 歸藏的AI工具箱
………………………………