一文讲明白，大模型显存占用计算方法（单卡状态）

江大白 · 公众号 · · 2024-08-24 08:00

文章预览

以下文章来源于微信公众号：深度学习与自然语言处理作者：然荻链接：https://mp.weixin.qq.com/s/IBWobzTtJKT65UDNr8p81Q 本文仅用于学术分享，如有侵权，请联系后台作删文处理导读大模型时代能够充分利用GPU的显存是一项非常有必要的技能。本文将在仅考虑单卡的情况下为大家讲明白大模型的内存占用机制，相信对大家后续训练、使用大模型都非常有帮助。知乎：然荻链接：https://zhuanlan.zhihu.com/p/713256008 纯知识分享，侵删 1.告诉你一个模型的参数量，你要怎么估算出训练和推理时的显存占用？ 2.Lora相比于全参训练节省的显存是哪一部分？Qlora相比Lora呢？ 3.混合精度训练的具体流程是怎么样的？这是我曾在面试中被问到的问题，为了巩固相关的知识，打算系统的写一篇文章，帮助自己复习备战秋招的同时，希望也能帮到各位小伙伴。这篇文章将围 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

每日豆瓣 · 一整根人参做的洗发水？我的发量有救了...

昨天

每日经济新闻 · 今日起，美团、哈啰单车在郑州市暂停运营，客服确认属实

昨天

作家张萌 · 张萌：活出高维的自己，从做减法开始

5 天前

作家张萌 · 张萌：活出高维的自己，从做减法开始

5 天前

每日豆瓣 · 79元买秋冬战衣？软乎乎，暖融融！给家里人都安排上了！

1 周前

李楠或kkk · 你看最终我选择定居广东是有道理的。他是全国唯二经济蓬勃发展而且抑-20240726152849

3 月前

江苏省数字化协会 · 会员迎新 |热烈欢迎江苏数风科技有限公司加入协会

3 月前

小白学视觉 · 8种概率统计分布（附Python代码）

2 月前

夏天的陈小舒 · 开团| 我盖了14年的被子，真找不到竞品，今年还出枕头啦

3 周前

夏天的陈小舒 · 开团| 我盖了14年的被子，真找不到竞品，今年还出枕头啦

3 周前