专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

Hugging Face Accelerate 两个后端的故事:FSDP 与 DeepSpeed

AINLP  · 公众号  ·  · 2024-07-01 22:01
    

文章预览

社区中有两个流行的 零冗余优化器 (Zero Redundancy Optimizer,ZeRO) 算法实现,一个来自 DeepSpeed ,另一个来自 PyTorch 。 Hugging Face Accelerate 对这两者都进行了集成并通过接口暴露出来,以供最终用户在训练/微调模型时自主选择其中之一。 本文重点介绍了 Accelerate 对外暴露的这两个后端之间的差异。为了让用户能够在这两个后端之间无缝切换,我们在 Accelerate 中合并了 一个精度相关的 PR 及 一个新的概念指南 。 零冗余优化器 (Zero Redundancy Optimizer,ZeRO) https://arxiv.org/abs/1910.02054 DeepSpeed https://github.com/microsoft/DeepSpeed PyTorch https://pytorch.org/docs/stable/fsdp.html Accelerate https://hf.co/docs/accelerate/en/index 一个精度相关的 PR https://github.com/huggingface/accelerate/issues/2624 一个新的概念指南 https://hf.co/docs/accelerate/concept_guides/fsdp_and_deepspeed FSDP 和 DeepSpeed 可以互换吗? 最近,我们尝 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览