大语言模型还没搞懂，“大世界模型”又来了

科普中国 · 公众号 · 科学 · 2024-12-25 15:30

主要观点总结

某AI科技公司推出了一款名为“大型世界模型”（LWM）的AI系统，可以通过输入图片生成完整的3D世界。系统允许用户以第一人称视角探索场景，具有真实物理感和动态效果。该系统的推出解决了像素生成的不一致性和稳定性问题，为创作提供了新的工具。虽然存在一些问题，如移动限制和画质模糊，但该公司表示这只是早期预览版，正在努力提高生成世界的规模和细节质量。该系统的应用前景广泛，可用于游戏开发、文学创作、梦境复现等领域。

关键观点总结

关键观点1: 新型AI系统通过图片生成3D世界。

输入任何图像，系统可以将其转化为3D场景，提供第一人称视角的探索体验。

关键观点2: 系统解决了像素生成的问题。

该系统克服了像素层面生成的不一致性和稳定性缺陷。

关键观点3: 系统具有真实物理感和动态效果。

用户可以在生成的空间内移动，并调节场景、添加动效，如光影、景深、色调。

关键观点4: 系统存在的问题与未来改进方向。

目前存在移动受限、画质模糊等问题，但公司表示正在努力提高生成世界的规模和细节质量。

关键观点5: 系统的广泛应用领域。

该系统可应用于游戏开发、文学创作、梦境复现等领域，为创作者提供新的创作工具。

文章预览

某 AI 行业科技公司刚刚推出了第一个项目：仅通过一张图片像就生成一个完整 3D 世界的 AI 系统。一键生成中世纪小镇丨World Labs 介绍博客里这样写道： “输入任何图像后，可以以 3D 方式探索它” ——给它一张图，它能将图中场景三维化，还不是静态的“2D 转 3D”，你能像游戏里的第一人称一样控制视角，探索场景。五花八门的场景丨World Labs 他们们管这叫 “大型世界模型”（Large World Model, LWM），他们也称自己为空间智能 AI 公司。完整系统还在邀请内测阶段，该公司在官网开放了即时演示，用户不仅可以看，还可以在浏览器直接操控视角转换，感受它塑造的世界。大震撼。 “一图一世界” 这个系统同之前英伟达曾开发过的“2D 转 3D”模型 Instant NeRF 完全不同—— Instant NeRF 的视角没有深度变化、受阻没有物理碰撞，甚至会发生直接穿 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博