Hugging Face Accelerate 两个后端的故事：FSDP 与 DeepSpeed

机器学习算法工程师 · 公众号 · · 2024-07-05 20:27

文章预览

社区中有两个流行的零冗余优化器 (Zero Redundancy Optimizer，ZeRO) 算法实现，一个来自 DeepSpeed ，另一个来自 PyTorch 。 Hugging Face Accelerate 对这两者都进行了集成并通过接口暴露出来，以供最终用户在训练/微调模型时自主选择其中之一。本文重点介绍了 Accelerate 对外暴露的这两个后端之间的差异。为了让用户能够在这两个后端之间无缝切换，我们在 Accelerate 中合并了一个精度相关的 PR 及一个新的概念指南。零冗余优化器 (Zero Redundancy Optimizer，ZeRO) https://arxiv.org/abs/1910.02054 DeepSpeed https://github.com/microsoft/DeepSpeed PyTorch https://pytorch.org/docs/stable/fsdp.html Accelerate https://hf.co/docs/accelerate/en/index 一个精度相关的 PR https://github.com/huggingface/accelerate/issues/2624 一个新的概念指南 https://hf.co/docs/accelerate/concept_guides/fsdp_and_deepspeed FSDP 和 DeepSpeed 可以互换吗？最近，我们尝 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

伊犁我的家 · 新疆：明年1月起定点零售药店不再接受纸质处方

昨天

伊犁我的家 · 打造向西开放的明珠城市和高能级百万人口城市伊宁市全面放开城镇落户限制

昨天

伊犁我的家 · 不发烧也会得肺炎？感染高峰请注意！医生提醒→

2 天前

伊犁我的家 · 今日起，伊犁正式进入！中到大雪+局部暴雪+大风来袭！接下来伊犁的天气……

2 天前

伊犁我的家 · 紧急预警！伊犁已出现

4 天前

首席商业评论 · 孙正义，少赚1万亿

5 月前

隔壁班学习园地 · 申论范文：让乡村特色产业各展其长

1 月前