专栏名称: AIWalker

关注计算机视觉、图像处理、深度学习等领域的干货分享与前沿paper解读。AIWalker由具有多年算法研究与产品化落地经验的Happy运营，原创为主、同时会转载优秀解读文章。欢迎志同道合的小伙伴们加入一同学习进步。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

超分辨图像无限生成！清华甩出Inf-DiT：Diffusion Transformer 任意分辨率上采样

AIWalker · 公众号 · · 2024-06-04 18:00

文章预览

↑ 点击蓝字关注极市平台作者丨科技猛兽编辑丨极市平台极市导读综合实验表明，Inf-DiT 在生成超高分辨率图像方面取得了 SOTA 性能。与常用的 UNet 结构相比，Inf-DiT 在生成 4096×4096 图像时可以节省超过5倍显存。 >> 加入极市CV技术交流群，走在计算机视觉的最前沿本文目录 1 Inf-DiT：Diffusion Transformer 任意分辨率上采样 (来自清华大学，唐杰团队) 1 Inf-DiT 论文解读 1.1 超高分辨率图像生成问题的挑战：GPU 显存需求 1.2 单向块注意力机制 1.3 O(N) 显存消耗的推理过程 1.4 Inf-DiT 架构 1.5 全局和局部一致性 1.6 实验结果太长不看版扩散模型在图像生成方面表现出了很显著的性能。然而对于生成超高分辨率的图像 (比如 4096 ×4096) 而言，由于其 Memory 也会二次方增加，因此生成的图像的分辨率通常限制在 1024×1024。在这项工作中。作者提出了一种单向块 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博