注册登录

专栏名称: Hugging Face

The AI community building the future.

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

科幻世界SFW · 强得可怕！爆火出圈的机器狗是如何“进化”的？ · 昨天

科幻世界SFW · “我和科幻有个约会”第五季主题活动走进雅安市 ... · 3 天前

科幻世界SFW · 《龙珠》《阿拉蕾》完结后，这本漫画才真正贯彻 ... · 3 天前

今天看啥 › 专栏 › Hugging Face

基于 Quanto 和 Diffusers 的内存高效 transformer 扩散模型

Hugging Face · 公众号 · · 2024-08-21 10:30

文章预览

过去的几个月，我们目睹了使用基于 transformer 模型作为扩散模型的主干网络来进行高分辨率文生图 (text-to-image，T2I) 的趋势。和一开始的许多扩散模型普遍使用 UNet 架构不同，这些模型使用 transformer 架构作为扩散过程的主模型。由于 transformer 的性质，这些主干网络表现出了良好的可扩展性，模型参数量可从 0.6B 扩展至 8B。随着模型越变越大，内存需求也随之增加。对扩散模型而言，这个问题愈加严重，因为扩散流水线通常由多个模型串成: 文本编码器、扩散主干模型和图像解码器。此外，最新的扩散流水线通常使用多个文本编码器 - 如: Stable Diffusion 3 有 3 个文本编码器。使用 FP16 精度对 SD3 进行推理需要 18.765GB 的 GPU 显存。这么高的内存要求使得很难将这些模型运行在消费级 GPU 上，因而减缓了技术采纳速度并使针对这些模型的实验变得更加困难 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

科幻世界SFW · 强得可怕！爆火出圈的机器狗是如何“进化”的？

昨天

科幻世界SFW · “我和科幻有个约会”第五季主题活动走进雅安市雨城区第四小学

3 天前

科幻世界SFW · 《龙珠》《阿拉蕾》完结后，这本漫画才真正贯彻了鸟山明的创作信念！

3 天前

杠杆地产 · 上市房企一季度资产负债率TOP10：第一名是国企

7 月前

游戏茶馆 · 英澈网络新游《晴空之下》登顶预约榜，主打“变身”的二次元战棋来了

5 月前

券商中国 · 一大波理财"羊毛"上新！34家券商大比拼，谁最划算？

4 月前

数据观 · 这一领域，中国超算位居世界第一！

1 月前

云技术 · 2.49亿元，盐城市政务云三期（单一来源）：华为云

3 周前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号