阿里发布开源语音交互模型 FunAudioLLM ：各种语音黑科技一应俱全

AI寒武纪 · 公众号 · · 2024-07-08 18:38

文章预览

阿里发布超强语音处理模型FunAudioLLM，语音方向卷起来了，成熟度非常高， FunAudioLLM是一个旨在增强人与大语言模型 (LLMs) 之间自然语音交互的框架。其核心包括两个创新模型： SenseVoice 和 CosyVoice SenseVoice 专注于高精度的多语言语音识别、情感识别和音频事件检测，具备极低的延迟，支持超过50种语言 SenseVoice 是一种语音基础模型，具有多种语音理解功能，包括 ASR、LID、SER 和 AED。SenseVoice-Small 是一种仅编码器的语音基础模型，用于快速语音理解；SenseVoice-Large 是一种编码器-解码器语音基础模型，用于更准确的语音理解，支持更多的语言 CosyVoice 则擅长自然语音生成，具备多语言、音色和情感控制能力，能够实现多语言语音生成、零样本语音生成、跨语言语音克隆和指令跟随功能 CosyVoice 包含一个自回归变换器，用于为输入文本生成相应的语音标记 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

看金坛 · “秒空”！最高溢价150%！

7 小时前

看金坛 · “秒空”！最高溢价150%！

7 小时前

深圳新闻网 · 6人被抓！警方紧急提醒

昨天

深圳新闻网 · 6人被抓！警方紧急提醒

昨天

雨生云计算 · 微软vs亚马逊:2025年哪家云计算股票表现更佳?

昨天

小易说钱 · 开始预约！蛇年生肖一克金！中钞长城发行！小克重，低价限量抢！

3 天前

茅酒圈 · i茅台蛇茅，笙乐飞天活动全攻略！

3 天前

茅酒圈 · i茅台蛇茅，笙乐飞天活动全攻略！

3 天前

城市的地得 · 掼蛋是消极抵抗

5 月前

平安研究 · 【平安研究】橙心研选20240906

4 月前

杨帅英语口语 · 每日积累“背三句”-旅游业

1 月前