DeepSpeed：所有人都能用的超大规模模型训练工具

人工智能与算法学习 · 公众号 · · 2024-10-22 18:47

文章预览

DeepSpeed：所有人都能用的超大规模模型训练工具原文地址：DeepSpeed: Extreme-scale model training for everyone 原文作者：DeepSpeed Team Rangan Majumder、Vice President Junhua Wang、VP、Distinguished Engineer 译文出自：掘金翻译计划本文永久链接：https://github.com/xitu/gold-miner/blob/master/article/2020/deepspeed-extreme-scale-model-training-for-everyone.md 译者：zhuzilin 校对者：samyu2000、luochen1992、lsvih 我们于今年 2 月份发布了 DeepSpeed。这是一个开源深度学习训练优化库，其中包含的一个新的显存优化技术—— ZeRO（零冗余优化器），通过扩大规模，提升速度，控制成本，提升可用性，极大地推进了大模型训练能力。DeepSpeed 已经帮助研究人员开发了图灵自然语言生成模型( Turing-NLG)，其在发表时为世界上最大的语言模型（拥有 170 亿参数），并有着最佳的精度。我们在 5 月份发布了 ZeRO-2——支持有 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

电影工厂 · 比打底裤还保暖！入冬穿这抗寒裤，护膝护腰，1条顶5条

8 小时前

电影工厂 · 激吻门11年后，吃上“天鹅肉”的最丑影帝王大治，如今怎么样了？

8 小时前

桃桃淘电影 · 孙锡久，继续性感，继续繁忙｜赏色

20 小时前

乌鸦预告片 · 视野上下打开！《封神第二部》IMAX预告画面多26%！

昨天

乌鸦预告片 · 视野上下打开！《封神第二部》IMAX预告画面多26%！

昨天

华夏时报 · 突发！又一A股董事长，被立案调查并留置

4 月前

山东宣传 · 为什么你的“累点”这么低

2 月前

越女事务所 · 被裁了，拿高额赔偿金...

4 周前