专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
今天看啥  ›  专栏  ›  极市平台

Pytorch 显存管理机制与显存占用分析方法

极市平台  · 公众号  ·  · 2024-06-14 22:00
    

文章预览

↑ 点击 蓝字  关注极市平台 作者丨不理不理@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/699254132 编辑丨极市平台 极市导读   本文深入探讨了PyTorch框架在内存管理方面的技术细节,特别是CUDA API的集成和优化。作者通过分析PyTorch 2.3.0版本,分享了GPU内存分配机制、内存单位的定义以及如何有效降低内存申请频率的策略。  >> 本周六 15 :00   极市直播特别栏目- CVPR2024论文分享会 ,7位中稿 工作 作者分享, 多篇ora l 和hightlig ht工作 ! 点击预约直播, 欢迎大家一起来交流学习 ! 近期在研究大模型推理加速框架 VLLM 源码的过程中,对 Pytorch 的显存占用和分配机制十分感兴趣,因此花了一些时间研究和测试。写作本文,既是笔记,也是分享。 1. 前言 1.1 设备及版本 操作系统:Ubuntu 22.04 驱动版本:535.161.08 GPU:A800-SXM4-80GB CUDA:12.1 Pytorch:2.3.0 Python:3.1 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览