文章预览
作者丨科技猛兽 编辑丨极市平台 极市导读 PixArt-Σ 比现有的文生图的扩散模型,例如 SDXL (2.6B 参数) 和 SD Cascade (5.1B 参数) 相比,其生成的图片质量卓越,而且拥有极佳的用户指令遵从性能,且模型参数明显更低 (0.6B 参数)。 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 本文目录 1 扩散模型解读 (五):PixArt 系列最新力作 PixArt-Σ:Weak-to-Strong 训练的 4K 高清文生图模型 (来自华为诺亚方舟实验室,大连理工大学,香港大学,香港科技大学) 1 PixArt-Σ 论文解读 1.1 生成 4K 高清大图的 PixArt-Σ:一个新的数据集,一个新的架构改进 1.2 高质量的训练数据 1.3 高效 DiT 架构设计 1.4 Weak-to-Strong 训练策略 1.5 实验结果 太长不看版 本文提出的 PixArt-Σ 是 PixArt 系列的最新力作,它是一个 Diffusion Transformer model (DiT),可以直接生成 4K 分辨率的图像。PixArt-Σ
………………………………