注册登录

专栏名称: OneFlow

不止于成为世界上最快的开源深度学习框架

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

江苏新闻 · 樊振东、陈梦、马龙落选？最新回应 · 11 小时前

江苏新闻 · 樊振东、陈梦、马龙落选？最新回应 · 11 小时前

四川观察sctv · 乒乓球亚洲杯国乒名单出炉！王楚钦、孙颖莎等出战 · 16 小时前

四川观察sctv · 乒乓球亚洲杯国乒名单出炉！王楚钦、孙颖莎等出战 · 16 小时前

今天看啥 › 专栏 › OneFlow

推算LLM训练的GPU内存需求

OneFlow · 公众号 · · 2024-11-08 08:03

文章预览

本文将分析大语言模型训练的GPU内存需求，主要包括三个方面：训练数十亿参数基于Transformer的LLM时，每个GPU设备需要多少GPU内存；估算内存需求的公式是什么；如果模型无法匹配内存，在实践中应采取哪些措施来减少内存需求。（本文由OneFlow编译发布，转载请联系授权。原文：https://medium.com/@maxshapp/understanding-and-estimating-gpu-memory-demands-for-training-llms-in-practise-c5ef20a4baff）作者 | Max Shap 翻译｜张雪聃、林心宇 OneFlow编译题图由 SiliconCloud 平台生成 1 是什么占用了GPU 内存？这是当我在首次训练一个数十亿参数的LLM时，一看到错误就立刻问自己的第一个问题： RuntimeError: CUDA out of memory（运行时错误：CUDA内存不足）我敢打赌，每个机器学习工程师都见过这个报错成千上万次。在深度学习模型的早期时代（例如VGG或ResNet），常见解决方案是减少batch_size ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

江苏新闻 · 樊振东、陈梦、马龙落选？最新回应

11 小时前

江苏新闻 · 樊振东、陈梦、马龙落选？最新回应

11 小时前

四川观察sctv · 乒乓球亚洲杯国乒名单出炉！王楚钦、孙颖莎等出战

16 小时前

四川观察sctv · 乒乓球亚洲杯国乒名单出炉！王楚钦、孙颖莎等出战

16 小时前

中关村储能产业技术联盟 · 阳光电源/中车株洲所/宁德时代/比亚迪等参与项目获奖！2023年度国家科学技术奖揭晓

6 月前

澳财 · 首席说｜澳元强势迷局：何时出手？一文揭晓

6 月前

Mao_Yan · 【GTAOL】全网首发！大仓员工无限取货！史上最快满仓方法！仅需5个小时即可全满！有手就行【猫眼】

3 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号