今天看啥  ›  专栏  ›  GitHubStore

极速语音识别OmniSenseVoice

GitHubStore  · 公众号  ·  · 2024-10-11 08:44

文章预览

项目简介 Omni SenseVoice 基于 SenseVoice 构建,针对闪电般的快速推理和精确的时间戳进行了优化,为您提供更智能、更快速的方式来处理音频转录! 安装 pip install . 用法 omnisense transcribe [OPTIONS] AUDIO_PATH   关键选项: --language  : 自动检测语言或指定(  auto, zh, en, yue, ja, ko  )。 --textnorm  :选择是否应用逆文本标准化(  withitn for inverse normalized  或 woitn for raw  )。 --device-id  :在特定 GPU 上运行(默认值:CPU 为 -1)。 --quantize  :使用量化模型来加快处理速度。 --help  : 显示详细帮助信息。 基准 omnisense benchmark -s -d --num-workers 2 --device-id 0 --batch-size 10 --textnorm woitn --language en benchmark/data/manifests/libritts/libritts_cuts_dev-clean.jsonl Optimize GPU WER ⬇️ RTF ⬇️ Speed Up 🔥 baseline(onnx) NVIDIA L4 GPU 4.47% 0.1200 1x torch NVIDIA L4 GPU 5.02% 0.0022 50x With Omni SenseVoice, experience up ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览