今天看啥  ›  专栏  ›  智源社区助手

活动报名|声学大模型,零样本跨语言语音识别(MMS Zero-shot)

智源社区助手  · 公众号  ·  · 2024-09-06 12:00

文章预览

报告主题: 零样本跨语言语音识别(MMS Zero-shot) 报告日期: 09月11日(周三)10:30-11:30 报告要点: 尽管自动语音识别(ASR)在语言覆盖方面取得了重大进展,但仍有许多语言未被覆盖。为了解决这一问题,我们提出了 MMS Zero-shot,这是一种简单的使用罗马化(romanization)而非复杂的音素化的方法。我们首先在包含1078种语言的标注数据集上训练了一个多语言的声学模型(acoustic model),然后在测试阶段,只需要很少量的未标记文本,就可以实现在任何未见过的语言上进行语音识别。这种方法将100种以前未见过的评估语言的平均字符错误率降低了46%,性能远超以往的零样本方法。MMS Zero-shot 在评估语言上的错误率仅为监督模型的2.5倍。本文探讨了 MMS Zero-shot 如何将自动语音识别技术推广到任何语言。 报告嘉宾: 赵锦铭,澳大利亚莫纳什大学的博士生 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览