专栏名称: AIGC开放社区

专注AIGC（生成式人工智能）领域的专业社区，关注GPT-4、百度文心一言、华为盘古等大语言模型（LLM）的发展应用和落地，以及国内LLM的发展和市场研究，社区秉承共建、共享、开放的理念，提供对社区会员有价值的商业化思路和服务。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

超过Sora！谷歌发布Veo 2，支持4K、逼真到难以分辨

AIGC开放社区 · 公众号 · 互联网短视频科技自媒体 · 2024-12-17 02:20

主要观点总结

本文介绍了谷歌Deepmind最新发布的文生视频模型Veo 2和文生图模型Imagen 3。Veo 2可直接生成8秒4K视频，能根据用户需求进行精准摄像头生成，具备出色的物理模拟效果，在总体偏好和文本语义还原方面都超过了其他模型。Imagen 3能生成构图更好、光影更明亮的图像，能精准呈现多种艺术风格。目前Veo 2支持候补测试申请，Imagen 3已全面推出使用。

关键观点总结

关键观点1: 谷歌Deepmind发布最新文生视频模型Veo 2

Veo 2可直接生成8秒4K视频，具备精准的摄像头生成功能和出色的物理模拟效果，在总体偏好和文本语义还原方面都超过了其他模型。

关键观点2: Veo 2的应用举例

包括火烈鸟涉水、混种狗在游泳池中的场景、女医生在实验室的镜头、早餐场景等，展示了Veo 2生成视频的细节、物理模拟和文本语义还原的效果。

关键观点3: 谷歌同时发布了文生图模型Imagen 3

Imagen 3能生成更好的构图、更明亮的图像，能精准呈现多种艺术风格，包括写实、印象派、赛博朋克、抽象到二次元动漫等，文本语义还原也更加优秀。

关键观点4: Veo 2和Imagen 3的可用性

目前Veo 2支持候补测试申请，Imagen 3已全面推出使用，可以在谷歌的ImageFX直接使用。

文章预览

今天凌晨1点，谷歌Deepmind发布了最新文生视频模型——Veo 2。 Veo 2可直接生成8秒4K视频，同时能根据用户对镜头类型、拍摄角度、电影效果等需求进行精准摄像头生成，包括低角度跟踪镜头、特写镜头等不同类型。例如，18mm 镜头的广角效果、浅景深聚焦主体，这对于影视媒体制作人员来说帮助巨大。此外，Veo 2具备很强的物理模拟效果，在动作一致性、光影处理、运动频率以及写真等方面非常优秀。根据Veo 2的测试数据显示，在总体偏好方面达到了58.8%，大幅度超过了Sora Turbo、可灵1.5、Minimax、Meta Gen ，而在文本语义还原方面，以58.2%同样超过了这些模型。基本上，Veo 2已经成为目前T0级别的视频模型。以下是Veo 2生成的视频欣赏，细节、物理模拟、文本语义还原真的很好。一个低角度的镜头捕捉到一群粉红色的火烈鸟在郁郁葱葱、宁静的泻湖中 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博