李飞飞空间智能首秀：AI靠单图生成3D世界，可探索，遵循基本物理几何规则

量子位 · 公众号 · AI · 2024-12-03 07:26

主要观点总结

李飞飞空间智能首个项目发布：仅凭借一张图就能生成具有交互性的3D游戏世界。该系统具有实时渲染、模拟景深、可调节模拟光影等效果，可生成持久、真实的3D世界，遵循基本的3D几何物理规则。该系统的发布被认为是空间智能的一个缩影，目标是让计算机能够看、学习、行动，并对艺术家、设计师等专业人士提供有用的工具。

关键观点总结

关键观点1: AI系统生成交互性3D世界

系统仅需要一张图片作为输入，能够生成一个可交互的3D游戏世界，其中可以探索场景，并模拟景深、移动视角等效果。

关键观点2: 系统的特点和优势

系统实时渲染，可控制摄像机效果，模拟景深和滑动变焦效果。生成的3D世界持久存在，遵循基本的3D几何物理规则。

关键观点3: 空间智能的概念和前景

李飞飞提出空间智能的概念，通过视觉化为洞察、看见成为理解、理解导致行动的方式解决问题。空间智能的最新里程碑是教计算机看到、学习、行动，加速机器人学习的发展。

关键观点4: World Labs公司的前景和目标

World Labs公司的目标客户包括视频游戏开发商和电影制片厂等专业人士。公司致力于改进生成世界的规模和逼真度，并尝试新的方式让用户与之互动。

文章预览

衡宇西风发自凹非寺量子位 | 公众号 QbitAI 就在刚刚，李飞飞空间智能首个项目突然发布：仅凭借1张图，就能生成一个3D游戏世界的AI系统！重点在于，生成的3D世界具有交互性。能够像玩游戏那样，自由地移动相机来探索这个3D世界，浅景深、希区柯克变焦等操作均可行。随便输入一张图：除了这张图本体，可探索的3D世界里，所有东西都是AI生成的：这些场景在浏览器中实时渲染，配备了可控的摄像机效果和可调节的模拟景深（DoF）。你甚至可以改变其中物体颜色，动态调整背景光影，在场景中插入其他对象。此外，之前大多数生成模型预测的是像素，而这个AI系统直接预测3D场景。所以场景在你移开视线再回来时不会发生变化，并且遵循基本的3D几何物理规则。网友们直接炸开锅，评论区“难以置信”一词直接刷屏。其中不乏Shop ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博