一文读懂 PyTorch 显存管理机制

深度学习基础与进阶 · 公众号 · · 2024-06-23 22:31

文章预览

作者丨米阿罗@知乎（已授权转载）来源丨https://zhuanlan.zhihu.com/p/486360176 编辑丨小书童,集智书童 1、背景介绍剖析 PyTorch 显存管理机制主要是为了减少「显存碎片化」带来的影响。一个简单示例为：如上图所示，假设当前想分配 800MB 显存，虽然空闲的总显存有 1000MB，但是上方图的空闲显存由地址不连续的两个 500MB 的块组成，不够分配这 800MB 显存；而下方的图中，如果两个 500MB 的空闲块地址连续，就可以通过显存碎片的整理组成一个 1000MB 的整块，足够分配 800MB。上方图的这种情况就被称为「显存碎片化」。「解决方法」：当有多个 Tensor 可以被释放时，可以优先释放那些在内存空间上前后有空闲内存的 Tensor。这样便于 PyTorch 整理这些空闲块组成的碎片，让三个块组成一整个更大的块。「核心问题/前提」：能否以非常小的代价（ O(1) 或 O(lo ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

南京日报 · 南京这项成果，凭啥入选年度十大科学突破？

昨天

南京日报 · 南京这项成果，凭啥入选年度十大科学突破？

昨天

原理 · 该不该创造镜像生命？

3 天前

星嘉坡眼 · 中国留学生来新加坡租房难！中国学联来帮忙

4 天前

BioArtMED · Science | 调控肿瘤相关CD8+T细胞干性的表观遗传因子

4 天前

科普中国 · 这种香料真的适合在冬天多吃！原因超有趣

4 天前

孤烟暮蝉 · 川普勒索冯德莱恩，张口就要4000亿美元

5 月前

黄建同学 · Groq最近发布了两个专为工具使用而设计的新开源模型： Lla-20240721155850

5 月前

数星星的星哥 · 今天无数读者在后台给我发这张图了😤😤

4 月前

知识泥土六二三 · 受粘液启发的水凝胶是啥？有啥作用？

3 月前

老岳爱房子 · 深圳买房指南【深圳湾篇】

2 月前