太卷了！谷歌首发视频配音功能，让视频生成模型Voe直接起飞！

机器学习算法工程师 · 公众号 · · 2024-06-18 07:54

文章预览

点蓝色字关注 “机器学习算法工程师 ” 设为星标，干货直达！随着OpenAI的Sora发布，视频生成模型正在快速发展，比如最近 Runway发布的Gen-3，谷歌发布的Veo ，快手发布的可灵以及Luma发布的Dream Machine 。但当前生成的视频是无声的，为这些无声视频创造配乐，是让生成的电影栩栩如生的下一个重要步骤。所以谷歌AI团队最新发布了一个新的工作：从视频生成音频（video-to-audio，V2A），这使得同步视听生成成为可能。V2A将视频像素与自然语言文本提示结合起来，为屏幕上的动作生成丰富的音乐背景。谷歌的V2A技术可以与自家的视频生成模型Veo配对，创造出具有戏剧性配乐、逼真的音效或与视频角色和基调相匹配的对话的场景。还能为一系列传统影像生成配乐，包括档案材料、无声电影等——为创意提供了更广泛的机遇。先上一些具体的例子： Pr ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博