今天看啥  ›  专栏  ›  AGI Hunt

重磅!Rev发布Whisper终结者:Reverb ASR

AGI Hunt  · 公众号  ·  · 2024-10-06 00:30
    

文章预览

语音识别领域迎来新王者! Rev公司刚刚发布了一款堪称"Whisper终结者"的开源语音识别模型, 一举打破了当前语音识别和说话人分离的最高水平 。 这款名为 Reverb ASR 的模型,不仅性能强劲,还大方地将模型权重公开在了Hugging Face Hub上。 这一举动可谓是给语音识别领域带来了一股新鲜血液! Reverb ASR:200K小时数据训练的超级模型 Reverb ASR可不是泛泛之辈。它 在前所未有的20万小时人工转录数据上进行训练 ,成功达到了目前业界最低的词错误率(WER)。 更令人兴奋的是, 这个模型还支持可定制的逐字转录 。这意味着用户可以根据自己的需求,灵活调整转录的精确度和风格。 说话人分离:26K小时标注数据的加持 Rev团队没有止步于语音识别。他们还在说话人分离(Diarization)方面下足了功夫。 通过利用 2.6万小时的标注数据 ,他们对pyannote模型进行了 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览