专栏名称: 关于NLP那些你不知道的事

整理自然语言处理、推荐系统、搜索引擎等AI领域的入门笔记，论文学习笔记和面试资料（关于NLP那些你不知道的事、关于推荐系统那些你不知道的事、NLP百面百搭、推荐系统百面百搭、搜索引擎百面百搭）

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

Stable Diffusion不同部件拆分详解

关于NLP那些你不知道的事 · 公众号 · · 2024-09-21 00:00

文章预览

作者：别说话-看头像原文地址：https://zhuanlan.zhihu.com/p/719145259 看到很多文章对Stable Diffusion各种原理、详解等，但是么有看到有文章细拆里面各个子模块在做啥，怎么做的，所以就会遇到整体原理理解很透传，问到细节就卡住，这段时间细看了一下文章，对各个部分做一个拆解详解。 Stable Diffusion由多个子网络组成，包括文本编码器、UNet和VAE三大部分。组合在一起可以看做一个接收文本输入，输出图像的模型。整体上看是一个接收文本输入，并输出图像的模型。Stable Diffusion处理的过程如下：输入文本，使用CLIP模型对文本进行编码，获得文本Embedding 噪声输入VAE编码器，获取潜空间生成噪声Latent 将文本Embedding和Latent输入UNet模型，预测Latent中的噪声去除Latent中的噪声，去除噪声后的结果重新赋值为Latent 重复步骤3、4直至噪声去除干净（step=30/50/1000 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博