阿里云大数据AI平台依托阿里领先的云基础设施、大数据和AI工程能力、场景算法技术和多年行业实践,一站式地为企业和开发者提供云原生的大数据和AI能力体系。帮助提升AI应用开发效率,促进AI在产业中规模化落地,激发业务价值。
目录
相关文章推荐
今天看啥  ›  专栏  ›  阿里云大数据AI平台

BladeDISC++:Dynamic Shape AI 编译器下的显存优化技术

阿里云大数据AI平台  · 公众号  ·  · 2025-01-17 13:54
    

文章预览

近年来,随着深度学习技术的迅猛发展,越来越多的模型展现出动态特性,这引发了对动态形状深度学习编译器(Dynamic Shape AI Compiler)的广泛关注。本文将介绍阿里云 PAI 团队近期发布的 BladeDISC++项目,探讨在动态场景下如何优化深度学习训练任务的显存峰值,主要内容包括以下三个部分: Dynamic Shape 场景下显存优化的背景与挑战 BladeDISC++的创新解决方案 Llama2 模型的实验数据分析 本文内容来自   NeurIPS WorkShop 2024 论文: BladeDISC++: Memory Optimizations Based On Symbolic Shape 论文链接: https://arxiv.org/abs/2412.16985 01 背景与挑战 动态形状深度学习编译器的挑战 随着模型架构的不断演进,其动态性日益增强。例如,传统的计算机视觉(CV)模型中,图像尺寸和批量大小(batch size)在训练过程中会不断变化;大型语言模型的序列长度和批量大小也呈动态调整状态;多 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览