Insanely Fast Whisper：超快的Whisper语音识别脚本

GitHubStore · 公众号 · · 2023-10-21 08:23

文章预览

项目简介这篇内容介绍了OpenAI的Whisper Large v2语音转录模型的超快速能力。通过使用Transformers和Optimum技术，可以在不到10分钟内转录300分钟（5小时）的音频。作者提供了几种优化方式，包括批处理、半精度处理以及BetterTransformer，以提高转录速度。最终，作者以实际测试数据展示了不同优化方式的速度对比。同时，还提到了Whisper.cpp的性能测试、4位推断性能测试、以及一个CLI工具的社区展示。这篇文章旨在展示如何使Whisper模型在转录2-3小时的音频时更加高效。基本上你需要做的就是这样： import torch from transformers import pipeline pipe = pipeline( "automatic-speech-recognition" , "openai/whisper-large-v2" , torch_dtype=torch.float16, device= "cuda:0" ) pipe.model = pipe.model.to_bettertransformer() outputs = pipe( " " , chunk_length_s=30, batch_siz ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

雨果网 · 万亿商机，赢在日亚-11.08厦门亚马逊日本千人峰会

昨天

雨果网 · 大批卖家受影响！亚马逊多项新规实施

2 天前

雨果网 · “浙向全球杭行四海”2025亚马逊卖家启动大会· 杭州站重磅来袭，共庆75华诞！

2 天前

雨果网 · 工贸一体商家9.9大促日销暴增500%+！揭秘工厂入局全托管日销数万单秘诀!

1 周前

钙钛矿太阳能电池 · 吉林大学刘春雨&郭文滨最新AEM：有机配体对2D/3D钙钛矿太阳能电池的关键作用：综合综述

3 周前