专栏名称: AIGC Research
AIGC Research|AI for Creativity Plan (AI4C Plan)|from ShanghaiTech University|致力于探索AIGC赋能创意智能|保持卓越学术品位和极致艺术追求
今天看啥  ›  专栏  ›  AIGC Research

218-A2|视觉场景的结构、语义和身份表示;图生3D场景,图生关节家用品;图生极端表情人头;大型视图合成模型,动态镜面场景重建

AIGC Research  · 公众号  ·  · 2024-10-24 23:30
    

文章预览

AIGC   Research   < PaperDaily> 主编 | 庄才林(Cailin Zhuang) 技术支持 |胡耀淇(Yaoqi Hu) 发布日期 |2024年 10月 23 日| 周三 Topic: 3D Generation/Reconstruction|Scenes Representation|Programs, Words, and Embeddings The Scene Language: Representing Scenes with Programs, Words, and Embeddings 2024-10-22|Stanford, UC Berkeley|⭐️⭐️ http://arxiv.org/abs/2410.16770v1 https://ai.stanford.edu/~yzzhang/projects/scene-language/ 概述 本研究提出了一种新的 视觉场景表示方法,称为“场景语言”,旨在准确而简洁地描述视觉场景的结构、语义和身份 。该方法通过三个主要组成部分来实现: 程序、自然语言单词和嵌入 。程序定义了场景中实体的层次和关系结构,单词则总结了每个实体的语义类别,而嵌入则捕捉了每个实体的视觉身份 。通过从预训练语言模型中进行无训练推理, 该表示方法能够根据文本或图像输入推 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览