专栏名称: AI变革指南
分享AI大模型;分享让你高效的AI工具和应用;分享AI行业前沿资讯;关注我,一起拥抱新技术革命~
今天看啥  ›  专栏  ›  AI变革指南

DeepMind V2A技术:为无声视频配音!

AI变革指南  · 公众号  ·  · 2024-06-19 06:20
    

文章预览

今天,给大家介绍一下谷歌DeepMind最新的AI成果,一个可以给无声视频增加背景音乐的技术! (Video-to-Audio,简称V2A) 这项技术能够为 能够为无声视频生成丰富而同步的音轨,正好可以配合现在的视频生成AI使用(大部分的AI生成视频缺少背景音乐!) 下面是生成的例子例子,输入提示词: 一艘宇宙飞船在浩瀚的太空中高速穿梭,星星在它周围划过,科幻场景 但是 它有 局限性,需要开发者使用提示词为模型预先“介绍”视频可能的声音,暂时不能直接根据视频画面添加具体音效。 重要的是,V2A 可以为任何视频输入生成无限数量的音轨。可选择定义“正提示”来引导生成的输出产生所需的声音,或定义“负提示”来引导其远离不需要的声音。 这种灵活性使用户可以更好地控制 V2A 的音频输出,从而可以快速尝试不同的音频输出并选择最佳匹配。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览