别急着捧杀谷歌Veo2，毕竟曾被吹上天的Sora也翻了车

AI好好用 · 公众号 · AI · 2024-12-19 17:35

主要观点总结

文章介绍了谷歌推出的AI视频生成模型Veo2，该模型能够生成高分辨率的视频，并具有理解提示词、重建物理交互和人脸表情等功能。经过一系列演示和测评，发现Veo2在生成复杂任务和运动量大的场景方面有了显著提升，但仍存在物理错误、手部细节异常、复杂体育动作处理不当等问题。与Sora等模型相比，Veo2在某些方面表现更优秀，但也存在一定的改进空间。

关键观点总结

关键观点1: 谷歌推出AI视频生成模型Veo2

介绍了Veo2的主要功能，包括生成高分辨率视频、理解提示词、重建物理交互和人脸表情等。

关键观点2: Veo2的测评结果

经过一系列演示和测评，发现Veo2在生成复杂任务和运动量大的场景方面有了显著提升，但仍存在物理错误、手部细节异常、复杂体育动作处理不当等问题。

关键观点3: Veo2与其他视频生成模型的对比

通过一系列提示词测试，Veo2在某些方面表现更优秀，但在某些场景下仍需改进。一些博主发布了Veo 2和其他视频生成模型的对比视频。

文章预览

AI好好用报道编辑：杨文为了考住Veo2,也是难为人类了。总被 OpenAI 压着打的谷歌，终于扬眉吐气了！最近，谷歌连上几款大模型，个个备受好评。先是推出最强 AI 大模型 Gemini 2.0 ，接着又官宣了 AI 视频生成模型 Veo2 ，直接对着 OpenAI 的 Sora 贴脸开大。据介绍，Veo2 能生成 2 分钟以上时长、4k 分辨率的视频，也能理解提示词中的相机控制指令，还能重建出符合真实世界的物理交互和人脸表情。同时，在基于人类评估者的对比评估中整体表现远超对手。（该图也侧面显示，在 AI 视频生成模型方面，中国真的冲到了第一梯队，成为谷歌也不容小觑的对手）一众大佬也齐刷刷为其站台。官方给出的演示视频也相当惊艳。《权力与游戏》中的龙在高楼大厦间穿梭，这效果是不是吊打不少视觉特效师？（视频来自X博主@shlomifruchter）一只猫对着镜 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博