文章预览
前言 我除了有个 AI 生成壁纸的计划,还有一个想法就是用 AI 剪视频,AI 剪视频当然是需要 AI 理解视频,最简单的就是理解视频中的字幕,之前写过文章介绍如何用 AI 来识别语音。今天就利用阿里云开源项目制作 FunASR 进行语音识别。 《阿里云Funasr语音识别大模型本地部署,效果远超OpenAI的Whisper》 《OpenAI 开源的语音自动识别大模型 Whisper 本地Docker部署》 部署 部署文档链接: https://github.com/modelscope/FunASR/blob/main/runtime/readme_cn.md 这里是参考官方文档进行CPU 离线语音识别部署,先下载 Docker 镜像: sudo docker pull registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-cpu-0.4.5 然后创建模型文件夹,运行容器 mkdir -p ./funasr-runtime-resources/models sudo docker run -p 10095:10095 -it --privileged=true -v $PWD/funasr-runtime-resources/models:/workspace/models registry.cn-hangzhou.ali
………………………………