专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
今天看啥  ›  专栏  ›  黄建同学

阿里通义千问开源了两款基础语音模型:SenseVoice和Cos-20240709120633

黄建同学  · 微博  · AI  · 2024-07-09 12:06

文章预览

2024-07-09 12:06 本条微博链接 阿里通义千问开源了两款基础语音模型:SenseVoice和CosyVoice #ai# #chatgpt# • SenseVoice,一种多语言音频理解模型:其多语言语音识别在中文和粤语方面的表现比 Whisper 高出 50%,推理速度快 15 倍,并且支持最先进的情感识别和音频事件检测。 • CosyVoice,多语言音频生成模型,经过超过 170,000 小时的多语言音频数据训练,支持多语言语音生成、音色和情绪控制。CosyVoice 在多语言语音生成、零样本 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览