一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

大模型智能 · 公众号 · · 2024-11-14 00:00

文章预览

大模型智能｜分享来源 | 机器之心从文字生成三维世界的场景有多难？试想一下，如果我们要 “生成复活节岛的摩艾石像”，AI 怎么才能理解我们的需求，然后生成一个精美的三维场景？斯坦福的研究团队提出了一个创新性解决方案：就像人类使用自然语言（natural language）进行交流，三维场景的构建需要场景语言（Scene Language）。项目主页：https://ai.stanford.edu/~yzzhang/projects/scene-language/ 文章地址：https://arxiv.org/abs/2410.16770 这个新语言不仅能让 AI 理解我们的需求，更让它能够细致地将人类的描述转化为三维世界的场景。同时，它还具备编辑功能，一句简单指令就能改变场景中的元素！物体的位置、风格，现在都可以随意调整。 01 智能的场景理解再比如，输入 “初始状态的国际象棋盘”，模型可以自动识别并生成如下特征： 64 个黑白相间的格 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博