机器学习、深度学习、数据挖掘等人工智能领域的技术实战干货文章,这里都有!分享从业经验是我们的不变的准则……
今天看啥  ›  专栏  ›  机器学习算法工程师

太卷了!谷歌首发视频配音功能,让视频生成模型Voe直接起飞!

机器学习算法工程师  · 公众号  ·  · 2024-06-18 07:54
    

文章预览

点蓝色字关注 “机器学习算法工程师 ” 设为 星标 ,干货直达! 随着OpenAI的Sora发布,视频生成模型正在快速发展,比如最近 Runway发布的Gen-3,谷歌发布的Veo , 快手发布的可灵以及Luma发布的Dream Machine 。但当前生成的视频是无声的,为这些无声视频创造配乐,是让生成的电影栩栩如生的下一个重要步骤。 所以谷歌AI团队最新发布了一个新的工作: 从视频生成音频(video-to-audio,V2A) ,这使得同步视听生成成为可能。V2A将视频像素与自然语言文本提示结合起来,为屏幕上的动作生成丰富的音乐背景。 谷歌的V2A技术可以与自家的视频生成模型Veo配对,创造出具有戏剧性配乐、逼真的音效或与视频角色和基调相匹配的对话的场景 。还能为一系列传统影像生成配乐,包括档案材料、无声电影等——为创意提供了更广泛的机遇。 先上一些具体的例子: Pr ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览