文章预览
AIGC Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) Topic: Image Generation|Auto-regressive|Open-Source & Democratization, Integrating Understanding and Generation Open-MAGVIT2: An Open-Source Project Toward Democratizing Auto-regressive Visual Generation 2024-09-06|Tencent PCG - ARC Lab, THU, NJU|⭐️ 🟡 http://arxiv.org/abs/2409.04410v1 https://github.com/TencentARC/Open-MAGVIT2 概述 Open-MAGVIT2是一个开源的 自回归图像生成 项目,旨在推动自回归模型在视觉生成领域的发展。 该项目基于谷歌提出的MAGVIT-v2令牌化器,重构并优化了图像处理流程 ,显著提高生成效果和可扩展性。 通过引入超大词汇量(即218个代码),Open-MAGVIT2在ImageNet 256×256数据集上获得了1.17的重构FID ,展现了业界领先的性能。同时,项目中还用了不对称的令牌因式分解和“下一个子令牌预测”来改善生成质量,助力自回归模型
………………………………