今天看啥  ›  专栏  ›  Founder Park

Google发布AI视频Veo2、AI绘图Imagen3,Sora和DALL-E不香了

Founder Park  · 公众号  · 科技创业 科技自媒体  · 2024-12-17 15:18
    

主要观点总结

文章介绍了谷歌发布的视频生成模型Veo 2、图像生成模型Imagen 3,以及新的生成式AI实验性项目Whisk。Veo 2能生成4K电影级画质的视频,理解现实世界物理和运动细微差别,展现出色的相机控制功能。Imagen 3在图像生成方面实现了革命性的提升,能生成明亮、精准的图像,并表现出优秀的艺术风格还原能力。Whisk则是一个全新的尝试,通过上传图片来定义主体、场景和风格,创造出独特的作品。文章还提到了这三个产品的关键点及其内容展示。

关键观点总结

关键观点1: 谷歌发布视频生成模型Veo 2

Veo 2能遵循简单和复杂的指令,在物理模拟过程中展现出令人惊叹的生成质量,可以生成高达4K、超长分钟的精美视频。

关键观点2: Imagen 3图像生成模型的升级

Imagen 3在整体质感、构图、细节执行等方面取得了重大提升,能够生成明亮、精准的图像,并准确还原各种艺术风格。

关键观点3: 全新的生成式AI实验性项目Whisk的介绍

Whisk通过上传图片来定义主体、场景和风格,然后将它们重新混合,创造出独特的作品。这一过程依赖于Gemini模型和Imagen 3的协同工作。


文章预览

文章转载自「新智元」。 趁着 OpenAI 的发布季,谷歌也发布了不少重磅新品。 这次,是谷歌的视频生成模型——Veo 2。 全新发布的Veo 2,实测效果已经被许多人公认「超越Sora」。 作为谷歌最先进的视频生成模型,Veo 2更好地理解现实世界物理和运动的细微差别,理解电影摄影语言的能力(如镜头类型和效果),分辨率高达4K。 同时放出的,还有Imagen 3图像生成模型,和用图像而非文本作为prompt的工具Whisk。 无论是在LLM上,还是在视觉创作上,谷歌正在缩小和OpenAI的差距。 高达4K的分辨率,大大提升的细节和真实感,人体动作和表情的改善,以及更好的物理建模和时间一致性,都让Veo 2达到了顶级AI视频模型的级别。 在Meta的Movie Gen Bench上,Veo已经可以和Kling、Minimax、Sora掰手腕了。 01  Veo 2强势升级, 4K电影级画质 想象一下,只用简单文字描述,就能 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览