文章预览
本文经AI新媒体量子位(公众号ID:qbitai)授权转载,转载请联系出处 本文长度为 3216字 , 建议阅读 7分钟 本文为你分享实现AI自动为视频配音的 流程。 先来做个“真假美猴王”的游戏。 你将看到两段画面相同的视频,请判断哪段来自视频原声,哪段是AI根据视频画面配上的假声? 莫非两个都是真的?不可能,答案文末揭晓。(还有更多真假难辨的视频原声和配音大对比) 真假难辨,简直让人怀疑耳朵。模型合成的假音效,什么时候都这么逼真了?一切还得从这个自动为自然环境下的视频配音的项目说起。 视听关联 看闪电,知雷声。 对人类来说,声音和视觉通常会打包出现传递信息。就像一个孩子看到闪电会下意识捂住耳朵,看到沸腾的水会想起水汽呼呼的
………………………………