专栏名称: AIGCResearch
AIGC Research|AI for Creativity Plan (AI4C Plan)|from ShanghaiTech University|致力于探索AIGC赋能创意智能|保持卓越学术品位和极致艺术追求
今天看啥  ›  专栏  ›  AIGCResearch

186-A1|自回归视觉生成(开源民主,整合视觉理解与生成,高效DiT用于文生X,手写文本生成;复杂场景LoD渲染|Mon

AIGCResearch  · 公众号  ·  · 2024-09-09 21:00

文章预览

AIGC   Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) Topic: Image Generation|Auto-regressive|Open-Source & Democratization, Integrating Understanding and Generation Open-MAGVIT2: An Open-Source Project Toward Democratizing Auto-regressive Visual Generation 2024-09-06|Tencent PCG - ARC Lab, THU, NJU|⭐️ 🟡 http://arxiv.org/abs/2409.04410v1 https://github.com/TencentARC/Open-MAGVIT2 概述 Open-MAGVIT2是一个开源的 自回归图像生成 项目,旨在推动自回归模型在视觉生成领域的发展。 该项目基于谷歌提出的MAGVIT-v2令牌化器,重构并优化了图像处理流程 ,显著提高生成效果和可扩展性。 通过引入超大词汇量(即218个代码),Open-MAGVIT2在ImageNet 256×256数据集上获得了1.17的重构FID ,展现了业界领先的性能。同时,项目中还用了不对称的令牌因式分解和“下一个子令牌预测”来改善生成质量,助力自回归模型 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览