专栏名称: AIGC Research

AIGC Research｜AI for Creativity Plan (AI4C Plan)｜from ShanghaiTech University｜致力于探索AIGC赋能创意智能｜保持卓越学术品位和极致艺术追求

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

217-A1.1｜场景图增强图生文与文生图任务，自回归语言模型用于图像生成，无需训练的风格迁移，概念擦除，截断一致性模型｜Tue

AIGC Research · 公众号 · · 2024-10-23 21:00

文章预览

AIGC Research 主编｜庄才林（Cailin Zhuang）技术支持｜胡耀淇（Yaoqi Hu） Topic: Image Generation｜Scene Graph｜Image-to-Text and Text-to-Image Synergistic Dual Spatial-aware Generation of Image-to-Text and Text-to-Image 2024-10-20｜Tianjin U, NUS, ByteDance, CSU, A*STAR, HIT(SZ)｜NeurIPS 2024｜⭐️ 🟡 http://arxiv.org/abs/2410.15312v1 概述在视觉空间理解（VSU）领域，空间图像到文本（SI2T）和空间文本到图像（ST2I）是两项基本任务。现有的独立方法在空间理解方面表现不佳，主要由于三维空间特征建模的复杂性。本文提出了一种新的双重学习框架，将SI2T和ST2I任务结合在一起，通过共享的3D场景图（3DSG）表示来增强这两项任务的性能。该框架利用空间双重离散扩散（SD3）方法，借助中间特征来指导复杂的3D过程，从而实现互利共赢。通过在视觉空间理解数据集（VSD）上的实验，结果显示该系统在ST2I和S ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博