专栏名称: 3D视觉之心
3D视觉与SLAM、点云相关内容分享
今天看啥  ›  专栏  ›  3D视觉之心

比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型

3D视觉之心  · 公众号  ·  · 2024-08-20 07:00

文章预览

作者 | 新智元  编辑 | 新智元 点击下方 卡片 ,关注“ 3D视觉之心 ”公众号 第一时间获取 3D视觉干货 >> 点击进入→ 3D视觉之心技术交流群    新智元报道   编辑:alan 【新智元导读】 近日,来自加州大学尔湾分校等机构的研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。 训练一个扩散模型要多少钱? 之前最便宜的方法(Wuerstchen)用了28400美元,而像Stable Diffusion这样的模型还要再贵一个数量级。 大模型时代,一般人根本玩不起。 想要各种文生小姐姐,还得靠厂商们负重前行 为了降低这庞大的开销,研究者们尝试了各种方案。 比如,原始的扩散模型从噪声到图像大约需要1000步,目前已经被减少到20步左右,甚至更少。 当扩散模型中的基础模块逐渐由Unet(CNN)替换为DiT(Transformer)之后,一些根据Transforme ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览