注册
登录
专栏名称:
宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
【Mistral AI ...
·
4 天前
量子位
·
猫猫运动方程,首次被物理学家破解! ...
·
5 天前
爱可可-爱生活
·
本文通过将语言模型建模为广义结构方程模型并提 ...
·
5 天前
黄建同学
·
可口可乐的 AI ...
·
6 天前
中国人工智能学会
·
聚智促产 ...
·
6 天前
今天看啥
›
专栏
›
宝玉xp
经常用 OpenAI Whisper 将音频转录成文本的可能都被-20241028144813
宝玉xp
·
微博
·
AI
· 2024-10-28 14:48
文章预览
2024-10-28 14:48 本条微博链接 经常用 OpenAI Whisper 将音频转录成文本的可能都被坑过,经常会无端生成一些没有的内容,比如“字幕翻译”、“赌场”、“感谢”之类的,这是由于模型训练时,很多视频的字幕在结尾或中间穿插一些广告或鸣谢,影响了训练的准确性。所以通常在用 Whisper 的时候,需要做VAD(voice activity detection),只选取有人发声音的部分音频调用 Whisper 转录,转录完再重新对应原始时间轴。 现在 Whisper 幻觉 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
爱可可-爱生活
·
【Mistral AI Evals:一个用于运行Mistral -20241119140759
4 天前
量子位
·
猫猫运动方程,首次被物理学家破解! |《美国物理学杂志》正经研究
5 天前
爱可可-爱生活
·
本文通过将语言模型建模为广义结构方程模型并提出一种新的反事实生成-20241118060436
5 天前
黄建同学
·
可口可乐的 AI 广告↓#ai##ai视频#ChatGPT 黄建-20241117203258
6 天前
中国人工智能学会
·
聚智促产 兴教育才,2024第十三届中国智能产业高峰论坛暨中国人工智能学院院长与名师论坛在杭开幕
6 天前
神嘛事儿
·
俄罗斯应该会要求印度用黄金购买石油,否则滚蛋 -20240823231324
3 月前
上海房天下
·
高配生活尽收眼底!深嘉上府城市展厅璀璨盛启!
2 月前
公考齐麟
·
【每天一个小方法】一天一题学数量184(继续部分打折)
1 月前