专栏名称: AIGC挖掘机
博主喜欢AI,Web3相关前沿内容,喜欢分享和折腾技术,也专注AI时代的创业与副业研究,目前在一线城市小厂工作,全干工程师,这里是他灵感的发源地,经常有一些奇思妙想。工作之余会分享一些相关的热门资讯,实践教程,稀缺资源。
目录
相关文章推荐
今天看啥  ›  专栏  ›  AIGC挖掘机

用AI和阿里云FunASR实现视频语音识别和自动字幕脚本制作

AIGC挖掘机  · 公众号  ·  · 2024-07-22 22:53

文章预览

前言 我除了有个 AI 生成壁纸的计划,还有一个想法就是用 AI 剪视频,AI 剪视频当然是需要 AI 理解视频,最简单的就是理解视频中的字幕,之前写过文章介绍如何用 AI 来识别语音。今天就利用阿里云开源项目制作 FunASR 进行语音识别。 《阿里云Funasr语音识别大模型本地部署,效果远超OpenAI的Whisper》 《OpenAI 开源的语音自动识别大模型 Whisper 本地Docker部署》 部署 部署文档链接: https://github.com/modelscope/FunASR/blob/main/runtime/readme_cn.md 这里是参考官方文档进行CPU 离线语音识别部署,先下载 Docker 镜像: sudo docker pull  registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-cpu-0.4.5 然后创建模型文件夹,运行容器 mkdir -p ./funasr-runtime-resources/models sudo docker run -p 10095:10095 -it --privileged=true  -v $PWD/funasr-runtime-resources/models:/workspace/models registry.cn-hangzhou.ali ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览
推荐文章