主要观点总结
数据堂联合中国移动、Samsung、Meta等企业在INTERSPEECH2025国际会议上推出多语种对话语音语言模型研讨会,旨在通过举办MLC-SLM挑战赛和发布真实多语种对话语音数据集来促进语音对话方向的研究。本次研讨会设立了两个赛道,包括多语种对话语音识别和多语种对话语音日志与识别。数据集包含多种语言,并设置了训练集、开发集、评估集等。竞赛奖金总额为20,000美金,并且提供了注册方式和官方群等信息。
关键观点总结
关键观点1: 活动目的
通过MLC-SLM挑战赛和真实多语种对话语音数据集的发布,促进语音对话方向的研究。
关键观点2: 活动赛道
设立了两个赛道,包括多语种对话语音识别和多语种对话语音日志与识别。
关键观点3: 数据集介绍
包含多种语言,如英语、法语、德语等,总时长约1500小时的多语种对话语音数据。
关键观点4: 竞赛日程
详细列出了竞赛的注册、数据发布、论文提交等关键时间节点。
关键观点5: 竞赛奖金
本次竞赛奖金总额为20,000美金,优秀团队奖金包括第一名5,000美金等。
文章预览
数据堂联合中国移动、Samsung、Meta等全球多家知名企业,在即将举行的INTERSPEECH2025国际会议上推出多语种对话语音语言模型研讨会,即MLC-SLM Workshop2025。 旨在通过举办多语种对话语音语言模型 (MLC-SLM) 挑战赛,以及发布真实的多语种对话语音数据集来促进该方向的研究。 竞赛背景 目前,大语言模型(LLMs)在各种下游任务中均展现出卓越的性能,已成为语言理解和文本生成等任务的基础模型。近年来,研究者们开始关注如何将 LLMs 应用于语音和音频处理任务,如自动语音识别 (ASR)、音频字幕生成以及语音对话系统等新兴领域。 然而,构建强大的基于LLM的语音对话系统,在很大程度上依赖于真实世界的对话语音数据。这些数据涵盖了人类语音交流的多种复杂场景, 包括自然停顿、中断、说话者重叠和多样化的对话风格。 此类数据的稀缺性,尤其是在
………………………………