文章预览
AIGC Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) Topic: Image Generation BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities BiGR 2024-10-18|HKU, HKUST, Intellifusion, CUHK|⭐️ http://arxiv.org/abs/2410.14672v1 https://haoosz.github.io/BiGR 概述 在这项研究中,我们提出了一种新颖的条件图像生成模型BiGR, 该模型利用紧凑的二进制潜在编码来进行生成训练,旨在增强生成和表示能力 。BiGR是 首个在同一框架中统一生成和判别任务的条件生成模型 。该模型采用了二进制标记器、掩蔽建模机制和二进制转码器,以进行二进制代码预测。此外,我们引入了一种新颖的熵有序采样方法,以实现高效的图像生成。通过大量实验验证,BiGR在生成质量(以FID-50k衡量)和表示能力(通过线性探测准确性证明)上表现优越。同时,BiGR展示了
………………………………