1890美元，就能从头训练一个还不错的12亿参数扩散模型

机器学习研究组订阅 · 公众号 · AI · 2024-07-29 18:26

文章预览

只用1890美元、3700 万张图像，就能训练一个还不错的扩散模型。现阶段，视觉生成模型擅长创建逼真的视觉内容，然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研究者使用最先进的方法，也需要在 8×H100 GPU 上训练一个多月的时间。此外，训练大模型也对数据集提出了挑战，这些数据基本以亿为单位，同样给训练模型带来挑战。高昂的训练成本和对数据集的要求为大规模扩散模型的开发造成了难以逾越的障碍。现在，来自 Sony AI 等机构的研究者仅仅花了 1890 美元，就训练了一个不错的扩散模型，具有 11.6 亿参数的稀疏 transformer。论文地址：https://arxiv.org/pdf/2407.15811 论文标题：Stretching Each Dollar: Diffusion Training from Scratch on a Micro-Budget 项目（即将发布）：https://github.com/SonyResearch/micro_diff ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 用Coze做了个在我推荐过的论文里问答的机器人，在豆包里搜“爱可-20250222210248

22 小时前

爱可可-爱生活 · 【[517星]Open-Reasoner-Zero：开源的强化学-20250221141032

2 天前

爱可可-爱生活 · 【HunyuanVideo-Training：一个简单易用的视频-20250221141750

2 天前

爱可可-爱生活 · 恭喜@一个明天的太阳等3名用户获得【《零基础开发AI Agen-20250221120211

2 天前

爱可可-爱生活 · 【最全面的Grok 3已知信息汇总与解读】关键信息摘要：- 发布-20250220080309

3 天前

每日意图 · 指弹吉他《Cloud Catcher》：给对未来充满焦虑的人

7 月前

资本深潜号 · 跌出百亿阵营后，这家私募搞了个“大动作”

6 月前

张江发布 · 心脉医疗™自主研发的Vflower®静脉支架系统获批上市，张江又添一款创新医疗器械！

6 月前