文章预览
AIGC Research < PaperDaily> 主编 | 庄才林(Cailin Zhuang) 技术支持 |胡耀淇(Yaoqi Hu) 发布日期 |2024年 10月 23 日| 周三 Topic: 3D Generation/Reconstruction|Scenes Representation|Programs, Words, and Embeddings The Scene Language: Representing Scenes with Programs, Words, and Embeddings 2024-10-22|Stanford, UC Berkeley|⭐️⭐️ http://arxiv.org/abs/2410.16770v1 https://ai.stanford.edu/~yzzhang/projects/scene-language/ 概述 本研究提出了一种新的 视觉场景表示方法,称为“场景语言”,旨在准确而简洁地描述视觉场景的结构、语义和身份 。该方法通过三个主要组成部分来实现: 程序、自然语言单词和嵌入 。程序定义了场景中实体的层次和关系结构,单词则总结了每个实体的语义类别,而嵌入则捕捉了每个实体的视觉身份 。通过从预训练语言模型中进行无训练推理, 该表示方法能够根据文本或图像输入推
………………………………