主要观点总结
李飞飞空间智能首个项目发布:仅凭借一张图就能生成具有交互性的3D游戏世界。该系统具有实时渲染、模拟景深、可调节模拟光影等效果,可生成持久、真实的3D世界,遵循基本的3D几何物理规则。该系统的发布被认为是空间智能的一个缩影,目标是让计算机能够看、学习、行动,并对艺术家、设计师等专业人士提供有用的工具。
关键观点总结
关键观点1: AI系统生成交互性3D世界
系统仅需要一张图片作为输入,能够生成一个可交互的3D游戏世界,其中可以探索场景,并模拟景深、移动视角等效果。
关键观点2: 系统的特点和优势
系统实时渲染,可控制摄像机效果,模拟景深和滑动变焦效果。生成的3D世界持久存在,遵循基本的3D几何物理规则。
关键观点3: 空间智能的概念和前景
李飞飞提出空间智能的概念,通过视觉化为洞察、看见成为理解、理解导致行动的方式解决问题。空间智能的最新里程碑是教计算机看到、学习、行动,加速机器人学习的发展。
关键观点4: World Labs公司的前景和目标
World Labs公司的目标客户包括视频游戏开发商和电影制片厂等专业人士。公司致力于改进生成世界的规模和逼真度,并尝试新的方式让用户与之互动。
文章预览
衡宇 西风 发自 凹非寺 量子位 | 公众号 QbitAI 就在刚刚,李飞飞空间智能首个项目突然发布: 仅凭借1张图,就能生成一个3D游戏世界的AI系统! 重点在于,生成的3D世界 具有交互性 。 能够像玩游戏那样,自由地移动相机来探索这个3D世界,浅景深、希区柯克变焦等操作均可行。 随便输入一张图: 除了这张图本体,可探索的3D世界里,所有东西都是AI生成的: 这些场景在浏览器中 实时渲染 ,配备了可控的摄像机效果和可调节的模拟景深 (DoF) 。 你甚至可以改变其中物体颜色,动态调整背景光影,在场景中插入其他对象。 此外,之前大多数生成模型预测的是像素,而这个AI系统直接 预测3D场景 。 所以场景在你移开视线再回来时不会发生变化,并且 遵循基本的3D几何物理规则。 网友们直接炸开锅,评论区“难以置信”一词直接刷屏。 其中不乏Shop
………………………………