专栏名称: 关于NLP那些你不知道的事

整理自然语言处理、推荐系统、搜索引擎等AI领域的入门笔记，论文学习笔记和面试资料（关于NLP那些你不知道的事、关于推荐系统那些你不知道的事、NLP百面百搭、推荐系统百面百搭、搜索引擎百面百搭）

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

文生图模型原理，以及Stable Diffusion部署体验

关于NLP那些你不知道的事 · 公众号 · · 2024-11-15 07:00

文章预览

LLM推理优化系统工程概述作者：阿桂原文地址：https://zhuanlan.zhihu.com/p/4825348572 截止到目前市面上比较主流的基于文字生成影像的模型都是基于了3大部分组成的。 Encoder Model ， Generation Model ，Decoder Model。并且这三个部分是分开训练，然后组合在一起从而构成了文生图大模型。图片来源于B站李宏毅教授讲问生图原理，侵删。下面我们可以看一下Stable Diffusion, DAll -E ,以及Imagen的架构示意图。它们基本上也都是基于这三大部分构成的。一、关键的前置认知： 1.1 基础概念： FID分数：是一种衡量生成图像质量的指标，较低的FID分数表示更好的图像质量。 "red points: real images" 表示红色点代表真实图像的特征向量。 "blue points: generated images" 表示蓝色点代表生成图像的特征向量。 "FID = Frechet distance between the two Gaussians" 表示FID是两个高斯分布之间的弗雷歇距 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博