专栏名称: 大模型智能
机器学习算法、深度学习算法、自然语言处理等干货知识集中营
今天看啥  ›  专栏  ›  大模型智能

一句话爆改三维场景!斯坦福吴佳俊团队新作:场景语言,智能补全文本到3D的场景理解

大模型智能  · 公众号  ·  · 2024-11-14 00:00
    

文章预览

大模型智能|分享 来源 | 机器之心 从文字生成三维世界的场景有多难? 试想一下,如果我们要 “生成复活节岛的摩艾石像”,AI 怎么才能理解我们的需求,然后生成一个精美的三维场景? 斯坦福的研究团队提出了一个创 新性解决方案:就像人类使用自然语言(natural language)进行交流,三维场景的构建需要 场景语言(Scene Language) 。 项目主页:https://ai.stanford.edu/~yzzhang/projects/scene-language/ 文章地址:https://arxiv.org/abs/2410.16770 这个新语言不仅能让 AI 理解我们的需求,更让它能够细致地将人类的描述转化为三维世界的场景。同时,它还具备编辑功能,一句简单指令就能改变场景中的元素!物体的位置、风格,现在都可以随意调整。 01 智能的场景理解 再比如,输入 “初始状态的国际象棋盘”,模型可以自动识别并生成如下特征: 64 个黑白相间的格 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览