专栏名称: AI算法与图像处理

考研逆袭985，非科班跨行AI，目前从事计算机视觉的工业和商业相关应用的工作。分享最新最前沿的科技，共同分享宝贵的资源资料，这里有机器学习，计算机视觉，Python等技术实战分享，也有考研，转行IT经验交流心得

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

1.58-bit FLUX：推理显存降低5.1倍，不到5GB显存可跑！

AI算法与图像处理 · 公众号 · · 2025-01-03 17:49

文章预览

刚刚，字节团队发布了一个Flux模型的量化工作： 1.58-bit FLUX。1.58-bit FLUX 成功在FLUX.1-dev上使用1.58位权重（即值在{-1, 0, +1}中）量化方案，并基本保持原始模型生成1024x1024图像的性能。在使用1.58位操作优化的定制内核之后，可以实现模型存储减少7.7倍，推理内存减少5.1倍，并降低模型的推理延迟。 1.58-bit FLUX不仅将模型存储成本降低到2.9GB，同时推理显存之需要不到5GB。 1.58-bit FLUX的量化不需要图像数据集，这里只使用一个校准数据集，该数据集包含来自Parti-1k数据集和T2I CompBench的训练集的文本提示词，总共有7,232个提示词。量化将FLUX中FluxTransformerBlock和FluxSingleTransformerBlock的所有线性层的权重减少到1.58位，涵盖了模型总参数的99.5%。量化之后，1.58-bit FLUX在两个文生图benchmark上（GenEval 和T2I Compbench）能够基本保持原来Flux的性能，这说明量化后的1.58-bit ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

常观 · 假期刚结束！价格突然大跳水！

17 小时前

常观 · 假期刚结束！价格突然大跳水！

17 小时前

汇易咨询 · 海关数据：2025年1~2月我国四大油脂进口量同比降30%

2 天前

鹰潭市交通运输综合行政执法支队 · 多部门联合开展清明节、汛期安全隐患排查筑牢水上交通安全防线

3 天前

华泰期货要咨询 · 大商所期货品种之豆粕（下）

4 天前

艾媒服务号 · 艾媒咨询 | 2024-2025年中国小屏手机市场趋势与消费行为需求研究报告（会员免费）

4 月前

字母榜 · 36岁的王思聪，告别电竞

4 月前

杨浦区消保委 · 上海官宣细则！“国补”家电新增4类产品，手机等3类数码产品最高补500元

2 月前