文章预览
首先在谷歌硬盘上传Mp3语音文件 可以下载电脑版谷歌drive软件:Google Drive for desktop,使用更方便: 音频很快自动同步上传。 接下来使用Openai的whisper模型: https:// github.com/openai/whisp er 在ChatGPT中输入提示词: 你是一个编程高手,写一个谷歌colab的ipynb脚本,实现任务如下: 从huggingface下载Whisper large-v3-turbo语音转录模型文件,然后保存到谷歌Drive中的myaudio文件夹中; 读取谷歌Drive中的myaudio文件目录中所有子文件夹中的音频文件; 从谷歌Drive中调用Whisper large-v3-turbo模型将所有音频文件转录成文字,保存为txt文本文件,txt文件名和音频文件名保持同一个名称,txt文件保存在和音频文件的同一个文件夹中; 注意: 安装pydub库; 安装ffmpeg; 在调用Whisper模型时显式指定语言为英文; 代码示例: import whisper model = whisper.load_model("turbo") result = model.transcribe("audio.
………………………………