专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

李飞飞空间智能首秀:AI靠单图生成3D世界,可探索,遵循基本物理几何规则

量子位  · 公众号  · AI  · 2024-12-03 07:26
    

主要观点总结

李飞飞空间智能首个项目发布:仅凭借一张图就能生成具有交互性的3D游戏世界。该系统具有实时渲染、模拟景深、可调节模拟光影等效果,可生成持久、真实的3D世界,遵循基本的3D几何物理规则。该系统的发布被认为是空间智能的一个缩影,目标是让计算机能够看、学习、行动,并对艺术家、设计师等专业人士提供有用的工具。

关键观点总结

关键观点1: AI系统生成交互性3D世界

系统仅需要一张图片作为输入,能够生成一个可交互的3D游戏世界,其中可以探索场景,并模拟景深、移动视角等效果。

关键观点2: 系统的特点和优势

系统实时渲染,可控制摄像机效果,模拟景深和滑动变焦效果。生成的3D世界持久存在,遵循基本的3D几何物理规则。

关键观点3: 空间智能的概念和前景

李飞飞提出空间智能的概念,通过视觉化为洞察、看见成为理解、理解导致行动的方式解决问题。空间智能的最新里程碑是教计算机看到、学习、行动,加速机器人学习的发展。

关键观点4: World Labs公司的前景和目标

World Labs公司的目标客户包括视频游戏开发商和电影制片厂等专业人士。公司致力于改进生成世界的规模和逼真度,并尝试新的方式让用户与之互动。


文章预览

衡宇 西风 发自 凹非寺 量子位 | 公众号 QbitAI 就在刚刚,李飞飞空间智能首个项目突然发布: 仅凭借1张图,就能生成一个3D游戏世界的AI系统! 重点在于,生成的3D世界 具有交互性 。 能够像玩游戏那样,自由地移动相机来探索这个3D世界,浅景深、希区柯克变焦等操作均可行。 随便输入一张图: 除了这张图本体,可探索的3D世界里,所有东西都是AI生成的: 这些场景在浏览器中 实时渲染 ,配备了可控的摄像机效果和可调节的模拟景深 (DoF) 。 你甚至可以改变其中物体颜色,动态调整背景光影,在场景中插入其他对象。 此外,之前大多数生成模型预测的是像素,而这个AI系统直接 预测3D场景 。 所以场景在你移开视线再回来时不会发生变化,并且 遵循基本的3D几何物理规则。 网友们直接炸开锅,评论区“难以置信”一词直接刷屏。 其中不乏Shop ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览