用谷歌Colab免费批量将本地电脑上的Mp3语音文件转文字

Dance with GenAI · 公众号 · · 2024-10-17 17:22

文章预览

首先在谷歌硬盘上传Mp3语音文件可以下载电脑版谷歌drive软件：Google Drive for desktop，使用更方便：音频很快自动同步上传。接下来使用Openai的whisper模型： https:// github.com/openai/whisp er 在ChatGPT中输入提示词：你是一个编程高手，写一个谷歌colab的ipynb脚本，实现任务如下：从huggingface下载Whisper large-v3-turbo语音转录模型文件，然后保存到谷歌Drive中的myaudio文件夹中；读取谷歌Drive中的myaudio文件目录中所有子文件夹中的音频文件；从谷歌Drive中调用Whisper large-v3-turbo模型将所有音频文件转录成文字，保存为txt文本文件，txt文件名和音频文件名保持同一个名称，txt文件保存在和音频文件的同一个文件夹中；注意：安装pydub库；安装ffmpeg；在调用Whisper模型时显式指定语言为英文；代码示例： import whisper model = whisper.load_model("turbo") result = model.transcribe("audio. ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博