Qwen2-Audio开源，让VoiceChat更流畅！

魔搭ModelScope社区 · 公众号 · · 2024-08-10 12:00

文章预览

01 引言在一个通用的AI系统中，核心模型应该能够理解不同模态的信息。当前的大语言模型现在已经能够理解语言并进行推理，并且已经扩展到了更多的模态，包括视觉和音频。此前通义千问团队陆续发布了多个 Qwen 语言模型系列以及 Qwen-VL 和 Qwen-Audio 等多模态模型。今天，通义千问团队正式发布 Qwen2-Audio。这是 Qwen-Audio 的下一代版本，它能够接受音频和文本输入，并生成文本输出。Qwen2-Audio 具有以下特点：语音聊天：用户可以使用语音向音频语言模型发出指令，无需通过自动语音识别（ASR）模块。音频分析：该模型能够根据文本指令分析音频信息，包括语音、声音、音乐等。多语言支持：该模型支持超过8种语言和方言，例如中文、英语、粤语、法语、意大利语、西班牙语、德语和日语。模型效果通义千问团队已经在一系列基准数据集上 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

成都发布 · 四川疾控重要提醒

10 小时前

食业家 · 单品增长382％，西梅产品卖爆了

昨天

食业家 · 单品增长382％，西梅产品卖爆了

昨天

幸福成长札记 · 第71天在闲鱼上卖货，一单赚100的确香~

2 天前

蛋先生工作室 · 最新豆粕、玉米、生猪行情

2 天前

亿恩 · 求职潮来了！大批打工人“求变”

3 天前

白桃星座 · 土象的情感洁癖

4 月前

晨哨并购 · 【活动报名】全市场最高规格S基金峰会在等你，有退出需求的速来！

2 月前

剑胆琴心123 · 后台有人主动跟我“交流分享”，洋洋洒洒的写了几百字，是关于啥“缠-20250206124423

1 周前