AI要进步，居然得先学打游戏？

差评X.PIN · 公众号 · 热门自媒体 · 2024-12-06 00:00

主要观点总结

本文主要介绍了AI领域的最新进展，特别是世界模型的生成能力。多家AI公司宣布能够生成真实世界的模型，包括World Labs和谷歌DeepMind。这些模型可以生成逼真的场景，具备交互性和自由度，能够理解真实世界的运作规律。文章对两个主要模型的特性进行了描述和比较，并探讨了AI生成世界模型的训练方式和可能存在的问题。

关键观点总结

关键观点1: AI公司能够生成世界模型

近期多家AI公司如World Labs和谷歌DeepMind宣布能够生成世界模型，这些模型可以渲染出逼真的3D场景，具备交互性和自由度。

关键观点2: 世界模型的特性

这些世界模型能够理解真实世界的运作规律，通过输入提示词生成相应的效果。比如DeepMind的Genie 2模型，可以生成第一人称视角的版本，角色和交互也很丰富，甚至可以模拟自然场景的运动。

关键观点3: AI生成世界模型的训练方式

AI生成世界模型的训练方式与传统的文生图模型不同，它们不仅仅是基于视频素材进行学习，而是通过游戏素材进行学习。这样可以观察到角色动作的键盘操作如何影响画面和动作变化，从而对物体与环境的交互有更全面的理解。

关键观点4: 存在的问题和挑战

虽然这些世界模型取得了令人瞩目的进展，但它们仍然存在一些问题和挑战。比如演示中的效果与实际使用可能存在差距，以及这些模型是否真正理解现实世界的复杂性。此外，尽管这些模型能够在某些任务上表现出色，但距离达到人类智能的水平还有很长的路要走。

文章预览

开了眼了，上周编辑部还在说下半年感觉 AI 领域没啥大活儿了，结果没过几天就发现话放早了。宁猜怎么着，本来以为 AI 还停留在输入文字，然后出图出视频的这些程度上，结果这两天突然有几个 AI 公司，都开始宣布人家可以生成世界了。我勒乖乖，这不就是 AI 界做梦都想搞出来的 “ 世界模型 ” 嘛：能像人一样理解这个真实世界的超级 AI ！先是前几天的 World Labs ，虽然大家可能没听说过，但人家创始人可是著名 AI 科学家、斯坦福大学教授、美国科学院院士、机器学习奠基人之一、有 AI 教母之称的著名美籍华人科学家李飞飞。在 World Labs 官网上说到，这是世界上第一个能直接渲染出完整 3D 场景的 AI ，超越了传统生成模型的单纯像素预测，而且这场景还能有交互性和自由度。说人话就是，这玩意跟以前的生图生视频模型不 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博