专栏名称: 夕小瑶科技说
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
今天看啥  ›  专栏  ›  夕小瑶科技说

锤爆Sora,尺度最大,谷歌发布最强视频模型Veo2,叫板海螺可灵

夕小瑶科技说  · 公众号  · 科技自媒体  · 2024-12-17 13:40
    

主要观点总结

谷歌发布了两个重要模型:视频生成模型Veo 2和文生图模型Imagen 3。Veo 2可以生成高质量的视频,包括逼真的动作、场景和角色,而Imagen 3则能生成细节更好、光照更丰富、干扰更少的图像。这两个模型的发布与OpenAI的更新形成了鲜明对比,谷歌的发布被认为是具有突破性的。

关键观点总结

关键观点1: 谷歌发布的新模型

谷歌发布了两个重要模型:视频生成模型Veo 2和文生图模型Imagen 3。Veo 2能生成高质量的视频,包括逼真的动作、场景和角色。Imagen 3则能生成细节更好、光照更丰富、干扰更少的图像。

关键观点2: Veo 2的特点和限制

Veo 2可以生成高质量的视频,其参数和性能超越了Sora等模型。但目前只能在VideoFX平台上使用,且只能申请加入waitlist。完全体的Veo 2将慢慢推出,并集成到整个Google生态系统中。

关键观点3: Imagen 3的特点

Imagen 3是文生图模型,能生成细节更好、光照更丰富、干扰更少的图像。现在可以直接使用,使用地址为https://labs.google/fx/tools/image-fx。

关键观点4: 谷歌与OpenAI的对比

谷歌的模型发布与OpenAI的更新形成了鲜明对比,谷歌每次出现都放出具有突破性的模型,如Gemini 2.0和Veo 2,而OpenAI则更倾向于炒作。谷歌的交付速度受到信任,相比之下OpenAI的更新显得保守。


文章预览

之前,OpenAI 一直狙击谷歌的新产品。现在,这个回旋镖打回来了。 谷歌昨晚在 OpenAI 发布会之前,发布了两个重量级更新,一个是最先进的视频生成模型 Veo 2,一个是文生图模型 Imagen-3。 先给你看个视频: 打网球、挥拍、投篮、跑步,这不是运动会宣传片,而是谷歌这次发的Veo 2生成的视频!它扛住了大幅度运动的考验,我愿称之为年度尺度最大、效果最佳的视频模型! 拿 Sora 跟 Veo 2 对比一下,看完这个,瞬间感觉刚开的 OpenAI 订阅不香了…… Sora 20 美元版:5 秒视频时长、分辨率最高 720p Sora 200 美元版:20 秒视频时长、分辨率最高 1080p Veo 2:约 2 分钟视频时长、分辨率最高 4k 除了生成视频的参数,benchmark 表现也超越 Sora,一同比较的模型有 4 个,除了 Sora, 还有 Meta Movie Gen 和 Kling v1.5、Minimax。 左侧是整体满意度,右侧是提示词遵循度 谷歌这 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览