今天看啥  ›  专栏  ›  灵度智能

阿里发布Qwen2-Audio,开启大模型智能语音对话时代!

灵度智能  · 公众号  ·  · 2024-08-15 12:17
    

文章预览

“ Qwen2-Audio Technical Report ” 当前的大语言模型现在已经能够理解语言并进行推理,近日阿里正式发布 Qwen2-Audio,它能够接受音频和文本输入,并生成文本输出。 Qwen2-Audio 具有以下特点: 语音聊天:用户可以使用语音向音频语言模型发出指令,无需通过自动语音识别(ASR)模块。 音频分析:该模型能够根据文本指令分析音频信息,包括语音、声音、音乐等。 多语言支持:该模型支持超过8种语言和方言,例如中文、英语、粤语、法语、意大利语、西班牙语、德语和日语。 项目主页:https://qwenlm.github.io/blog/qwen2-audio/ 论文地址 :https://arxiv.org/pdf/2407.10759 Github 地址:https://github.com/QwenLM/Qwen2-Audio 摘要 Qwen2-Audio是一个大规模音频语言模型,能够接受各种音频信号输入并进行语音指令的分析或直接文本回复。模型通过自然语言提示简化了预训练过程,并扩 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览