专栏名称: AIGC开放社区
专注AIGC(生成式人工智能)领域的专业社区,关注GPT-4、百度文心一言、华为盘古等大语言模型(LLM)的发展应用和落地,以及国内LLM的发展和市场研究,社区秉承共建、共享、开放的理念,提供对社区会员有价值的商业化思路和服务。
今天看啥  ›  专栏  ›  AIGC开放社区

超过Sora!谷歌发布Veo 2,支持4K、逼真到难以分辨

AIGC开放社区  · 公众号  · 互联网短视频 科技自媒体  · 2024-12-17 02:20
    

主要观点总结

本文介绍了谷歌Deepmind最新发布的文生视频模型Veo 2和文生图模型Imagen 3。Veo 2可直接生成8秒4K视频,能根据用户需求进行精准摄像头生成,具备出色的物理模拟效果,在总体偏好和文本语义还原方面都超过了其他模型。Imagen 3能生成构图更好、光影更明亮的图像,能精准呈现多种艺术风格。目前Veo 2支持候补测试申请,Imagen 3已全面推出使用。

关键观点总结

关键观点1: 谷歌Deepmind发布最新文生视频模型Veo 2

Veo 2可直接生成8秒4K视频,具备精准的摄像头生成功能和出色的物理模拟效果,在总体偏好和文本语义还原方面都超过了其他模型。

关键观点2: Veo 2的应用举例

包括火烈鸟涉水、混种狗在游泳池中的场景、女医生在实验室的镜头、早餐场景等,展示了Veo 2生成视频的细节、物理模拟和文本语义还原的效果。

关键观点3: 谷歌同时发布了文生图模型Imagen 3

Imagen 3能生成更好的构图、更明亮的图像,能精准呈现多种艺术风格,包括写实、印象派、赛博朋克、抽象到二次元动漫等,文本语义还原也更加优秀。

关键观点4: Veo 2和Imagen 3的可用性

目前Veo 2支持候补测试申请,Imagen 3已全面推出使用,可以在谷歌的ImageFX直接使用。


文章预览

今天凌晨1点,谷歌Deepmind发布了最新文生视频模型——Veo 2。 Veo 2可直接生成8秒4K视频,同时能根据用户对镜头类型、拍摄角度、电影效果等需求进行精准摄像头生成,包括低角度跟踪镜头、特写镜头等不同类型。 例如,18mm 镜头的广角效果、浅景深聚焦主体,这对于影视媒体制作人员来说帮助巨大。 此外,Veo 2具备很强的物理模拟效果,在动作一致性、光影处理、运动频率以及写真等方面非常优秀。 根据Veo 2的测试数据显示, 在总体偏好方面达到了58.8%,大幅度超过了Sora Turbo、可灵1.5、Minimax、Meta Gen ,而在文本语义还原方面,以58.2%同样超过了这些模型。基本上,Veo 2已经成为目前T0级别的视频模型。 以下是Veo 2生成的视频欣赏,细节、物理模拟、文本语义还原真的很好。 一个低角度的镜头捕捉到一群粉红色的火烈鸟在郁郁葱葱、宁静的泻湖中 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览