AI视频技术突破静默，让每一帧画面实现声色同步 | 大模型一周大事

AI前线 · 公众号 · AI · 2024-06-24 14:40

文章预览

大模型的快节奏发展，让了解最新技术动态、积极主动学习成为每一位从业者的必修课。InfoQ 研究中心期望通过每周更新大模型行业最新动态，为广大读者提供全面的行业回顾和要点分析。现在，让我们回顾过去一周的大模型重大事件吧。一、重点发现视频生成模型的发展速度令人瞩目，在人工智能领域的竞争已经达到了白热化阶段。各大厂商之间的激烈角逐不仅推动了技术的快速进步，也为整个行业营造了一个更加公正和开放的竞争环境。尽管如此，从年初令人瞩目的 Sora 到近期的可灵、Luma、Gen-3 Alpha 等模型，它们所生成的视频作品均未能突破声音的局限。然而，Google DeepMind 推出的 V2A 技术，为这一问题提供了解决方案。从技术应用来看，V2A 技术与 Veo 等视频生成模型的结合，将能够创造出既具有戏剧性配乐、逼真音效，又能与视频中 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博