专栏名称: AIWalker

关注计算机视觉、图像处理、深度学习等领域的干货分享与前沿paper解读。AIWalker由具有多年算法研究与产品化落地经验的Happy运营，原创为主、同时会转载优秀解读文章。欢迎志同道合的小伙伴们加入一同学习进步。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

ECCV'24｜直接生成 4K图像！ PixArt-Σ：Weak-to-Strong 训练的 4K 高清文生图模型

AIWalker · 公众号 · · 2024-09-10 22:00

文章预览

作者丨科技猛兽编辑丨极市平台极市导读 PixArt-Σ 比现有的文生图的扩散模型，例如 SDXL (2.6B 参数) 和 SD Cascade (5.1B 参数) 相比，其生成的图片质量卓越，而且拥有极佳的用户指令遵从性能，且模型参数明显更低 (0.6B 参数)。 >> 加入极市CV技术交流群，走在计算机视觉的最前沿本文目录 1 扩散模型解读 (五)：PixArt 系列最新力作 PixArt-Σ：Weak-to-Strong 训练的 4K 高清文生图模型 (来自华为诺亚方舟实验室，大连理工大学，香港大学，香港科技大学) 1 PixArt-Σ 论文解读 1.1 生成 4K 高清大图的 PixArt-Σ：一个新的数据集，一个新的架构改进 1.2 高质量的训练数据 1.3 高效 DiT 架构设计 1.4 Weak-to-Strong 训练策略 1.5 实验结果太长不看版本文提出的 PixArt-Σ 是 PixArt 系列的最新力作，它是一个 Diffusion Transformer model (DiT)，可以直接生成 4K 分辨率的图像。PixArt-Σ ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博