今天看啥  ›  专栏  ›  科普中国

大语言模型还没搞懂,“大世界模型”又来了

科普中国  · 公众号  · 科学  · 2024-12-25 15:30
    

主要观点总结

某AI科技公司推出了一款名为“大型世界模型”(LWM)的AI系统,可以通过输入图片生成完整的3D世界。系统允许用户以第一人称视角探索场景,具有真实物理感和动态效果。该系统的推出解决了像素生成的不一致性和稳定性问题,为创作提供了新的工具。虽然存在一些问题,如移动限制和画质模糊,但该公司表示这只是早期预览版,正在努力提高生成世界的规模和细节质量。该系统的应用前景广泛,可用于游戏开发、文学创作、梦境复现等领域。

关键观点总结

关键观点1: 新型AI系统通过图片生成3D世界。

输入任何图像,系统可以将其转化为3D场景,提供第一人称视角的探索体验。

关键观点2: 系统解决了像素生成的问题。

该系统克服了像素层面生成的不一致性和稳定性缺陷。

关键观点3: 系统具有真实物理感和动态效果。

用户可以在生成的空间内移动,并调节场景、添加动效,如光影、景深、色调。

关键观点4: 系统存在的问题与未来改进方向。

目前存在移动受限、画质模糊等问题,但公司表示正在努力提高生成世界的规模和细节质量。

关键观点5: 系统的广泛应用领域。

该系统可应用于游戏开发、文学创作、梦境复现等领域,为创作者提供新的创作工具。


文章预览

某 AI 行业科技公司 刚刚推出了第一个项目: 仅通过一张图片像就生成一个完整 3D 世界的 AI 系统 。 一键生成中世纪小镇丨World Labs 介绍博客里这样写道: “输入任何图像后,可以以 3D 方式探索它” ——给它一张图,它能将图中场景三维化,还不是静态的“2D 转 3D”,你能 像游戏里的第一人称一样控制视角,探索场景。 五花八门的场景丨World Labs 他们们管这叫 “大型世界模型”(Large World Model, LWM) ,他们也称自己为空间智能 AI 公司。 完整系统还在邀请内测阶段,该公司在官网开放了即时演示,用户不仅可以看,还可以在浏览器直接操控视角转换,感受它塑造的世界。 大震撼。  “一图一世界”  这个系统同之前英伟达曾开发过的“2D 转 3D”模型 Instant NeRF 完全不同—— Instant NeRF 的视角没有深度变化、受阻没有物理碰撞,甚至会发生直接穿 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览