主要观点总结
本文介绍了谷歌Deepmind最新发布的文生视频模型Veo 2和文生图模型Imagen 3。Veo 2可直接生成8秒4K视频,能根据用户需求进行精准摄像头生成,具备出色的物理模拟效果,在总体偏好和文本语义还原方面都超过了其他模型。Imagen 3能生成构图更好、光影更明亮的图像,能精准呈现多种艺术风格。目前Veo 2支持候补测试申请,Imagen 3已全面推出使用。
关键观点总结
关键观点1: 谷歌Deepmind发布最新文生视频模型Veo 2
Veo 2可直接生成8秒4K视频,具备精准的摄像头生成功能和出色的物理模拟效果,在总体偏好和文本语义还原方面都超过了其他模型。
关键观点2: Veo 2的应用举例
包括火烈鸟涉水、混种狗在游泳池中的场景、女医生在实验室的镜头、早餐场景等,展示了Veo 2生成视频的细节、物理模拟和文本语义还原的效果。
关键观点3: 谷歌同时发布了文生图模型Imagen 3
Imagen 3能生成更好的构图、更明亮的图像,能精准呈现多种艺术风格,包括写实、印象派、赛博朋克、抽象到二次元动漫等,文本语义还原也更加优秀。
关键观点4: Veo 2和Imagen 3的可用性
目前Veo 2支持候补测试申请,Imagen 3已全面推出使用,可以在谷歌的ImageFX直接使用。
文章预览
今天凌晨1点,谷歌Deepmind发布了最新文生视频模型——Veo 2。 Veo 2可直接生成8秒4K视频,同时能根据用户对镜头类型、拍摄角度、电影效果等需求进行精准摄像头生成,包括低角度跟踪镜头、特写镜头等不同类型。 例如,18mm 镜头的广角效果、浅景深聚焦主体,这对于影视媒体制作人员来说帮助巨大。 此外,Veo 2具备很强的物理模拟效果,在动作一致性、光影处理、运动频率以及写真等方面非常优秀。 根据Veo 2的测试数据显示, 在总体偏好方面达到了58.8%,大幅度超过了Sora Turbo、可灵1.5、Minimax、Meta Gen ,而在文本语义还原方面,以58.2%同样超过了这些模型。基本上,Veo 2已经成为目前T0级别的视频模型。 以下是Veo 2生成的视频欣赏,细节、物理模拟、文本语义还原真的很好。 一个低角度的镜头捕捉到一群粉红色的火烈鸟在郁郁葱葱、宁静的泻湖中
………………………………