专栏名称: 阿里语音AI
阿里巴巴达摩院语音实验室,基于语音识别、语音合成、自然语言理解等 AI 技术,实现“能听、会说、懂你”式的智能人机交互体验,适用于智能客服、质检、会议纪 要、实时字幕等多种应用场景,支持私有化定制部署。
今天看啥  ›  专栏  ›  阿里语音AI

开源上新|FunASR多语言离线文件转写软件包

阿里语音AI  · 公众号  ·  · 2024-10-21 15:59
    

文章预览

FunASR是由通义实验室开源的语音识别框架,集成了语音端点检测、语音识别、标点预测等领域的工业级模型的训练和部署,吸引了众多开发者参与体验和开发。 为了支持用户便捷高效的集成语音AI能力,FunASR社区推出了服务部署社区软件包,支持Docker化部署,多路请求。面对社区用户的需求与反馈,本次推出 多语言离线文件转写软件包 , 通过SenseVoiceSmall模型可实现中、英、日、粤、韩多语言的服务部署,同时具备多种语音理解能力 ,涵盖了语音识别(ASR)、语言识别(LID)、情感识别(SER)以及音频事件检测(AED),可以进行高精度、高效率与高并发的文件转写。 图1 FunASR社区软件包发布路线图 FunASR社区软件包地址: https://github.com/modelscope/FunASR/blob/main/runtime/readme_cn.md ‍ ▎ 多语言离线文件转写软件包 图2 多语言离线文件转写服务架构图 上图 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览