专栏名称: 魔搭ModelScope社区
阿里巴巴达摩院模型开源社区ModelScope官方账号
今天看啥  ›  专栏  ›  魔搭ModelScope社区

Qwen2-Audio开源,让VoiceChat更流畅!

魔搭ModelScope社区  · 公众号  ·  · 2024-08-10 12:00
    

文章预览

01 引言 在一个通用的AI系统中,核心模型应该能够理解不同模态的信息。当前的大语言模型现在已经能够理解语言并进行推理,并且已经扩展到了更多的模态,包括视觉和音频。此前通义千问团队陆续发布了多个 Qwen 语言模型系列以及 Qwen-VL 和 Qwen-Audio 等多模态模型。今天, 通义千问团队 正式发布 Qwen2-Audio。这是 Qwen-Audio 的下一代版本,它能够接受音频和文本输入,并生成文本输出。Qwen2-Audio 具有以下特点: 语音聊天: 用户可以使用语音向音频语言模型发出指令,无需通过自动语音识别(ASR)模块。 音频分析: 该模型能够根据文本指令分析音频信息,包括语音、声音、音乐等。 多语言支持: 该模型支持超过8种语言和方言,例如中文、英语、粤语、法语、意大利语、西班牙语、德语和日语。 模型效果 通义千问团队 已经在一系列基准数据集上 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览