nnScaler：重塑深度学习并行策略，大幅提升训练效率

微软亚洲研究院 · 公众号 · AI · 2024-07-22 17:00

文章预览

（本文阅读时间：6分钟）编者按：深度学习技术已经在图像识别、语音识别、自然语言处理、搜索推荐等多个领域不断展现出巨大的应用价值。然而，随着模型规模的不断增大，深度学习模型的训练变得耗时且昂贵，设计最优的并行策略组合以提高其在多设备上的执行性能是目前该领域的一大挑战。在此背景下，微软亚洲研究院提出 nnScaler 技术，通过一套并行化原语和策略限定搜索的方法来寻求最佳的并行策略组合。这一尝试为寻求深度学习并行策略最优化提供了方案和工具，有效应对了当前的深度学习训练效率难题。相关论文已被计算机系统领域顶级学术会议 OSDI 2024 收录。目前，深度学习已经透过多种应用形式广泛深入人们的日常生活当中。但随着模型规模的不断增大，其训练变得耗时且昂贵。为此，科研人员不断设计出各种并行策略来提 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【ACU - Awesome Agents for Comput-20250106135257

昨天

黄建同学 · 测了Hedra的AI数字人（免费版），视频测了4个数字人，包括英-20250104085144

3 天前

爱可可-爱生活 · 【Jupyter Copilot：为JupyterLab设计的G-20250103173932

4 天前

量子位 · 刚拿下NeurIPS最佳论文，字节就开源VAR文生图版本，拿下SOTA击败扩散模型

4 天前

爱可可-爱生活 · Zasper：为数据科学家打造的超级IDE它在性能方面令人印象深-20250103133306

4 天前

Excel之家ExcelHome · 数据排序学得好，老板把你当成宝

7 月前

棉花展望 · 今日立冬 | 初冬微凉，遥祝冬安

2 月前