Google发布AI视频Veo2、AI绘图Imagen3，Sora和DALL-E不香了

Founder Park · 公众号 · 科技创业科技自媒体 · 2024-12-17 15:18

主要观点总结

文章介绍了谷歌发布的视频生成模型Veo 2、图像生成模型Imagen 3，以及新的生成式AI实验性项目Whisk。Veo 2能生成4K电影级画质的视频，理解现实世界物理和运动细微差别，展现出色的相机控制功能。Imagen 3在图像生成方面实现了革命性的提升，能生成明亮、精准的图像，并表现出优秀的艺术风格还原能力。Whisk则是一个全新的尝试，通过上传图片来定义主体、场景和风格，创造出独特的作品。文章还提到了这三个产品的关键点及其内容展示。

关键观点总结

关键观点1: 谷歌发布视频生成模型Veo 2

Veo 2能遵循简单和复杂的指令，在物理模拟过程中展现出令人惊叹的生成质量，可以生成高达4K、超长分钟的精美视频。

关键观点2: Imagen 3图像生成模型的升级

Imagen 3在整体质感、构图、细节执行等方面取得了重大提升，能够生成明亮、精准的图像，并准确还原各种艺术风格。

关键观点3: 全新的生成式AI实验性项目Whisk的介绍

Whisk通过上传图片来定义主体、场景和风格，然后将它们重新混合，创造出独特的作品。这一过程依赖于Gemini模型和Imagen 3的协同工作。

文章预览

文章转载自「新智元」。趁着 OpenAI 的发布季，谷歌也发布了不少重磅新品。这次，是谷歌的视频生成模型——Veo 2。全新发布的Veo 2，实测效果已经被许多人公认「超越Sora」。作为谷歌最先进的视频生成模型，Veo 2更好地理解现实世界物理和运动的细微差别，理解电影摄影语言的能力（如镜头类型和效果），分辨率高达4K。同时放出的，还有Imagen 3图像生成模型，和用图像而非文本作为prompt的工具Whisk。无论是在LLM上，还是在视觉创作上，谷歌正在缩小和OpenAI的差距。高达4K的分辨率，大大提升的细节和真实感，人体动作和表情的改善，以及更好的物理建模和时间一致性，都让Veo 2达到了顶级AI视频模型的级别。在Meta的Movie Gen Bench上，Veo已经可以和Kling、Minimax、Sora掰手腕了。 01 Veo 2强势升级， 4K电影级画质想象一下，只用简单文字描述，就能 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博