DeepSeek开源第二天：拉爆MoE训练和推理

夕小瑶科技说 · 公众号 · · 2025-02-25 17:08

文章预览

今天，在追求性能极致的路上，DeepSeek 又祭出新神器—— 专为 MoE 模型打造的 DeepEP 通信库。昨天主打干崩推理性能，今天双管齐下，训练和推理一起拿下，依旧是所到之处寸草不生的野蛮收割。（PS：这还是我印象里的以天下为公的谦谦君子版 deepseek 么，这两天开源直接变身不择手段的性能狂魔）这次开源的是—— DeepEP，是首个用于 MoE 模型训练和推理的开源 EP 通信库，用于训练和推理的高吞吐量和低延迟依旧是先说结论：实现高效的 all-to-all 通信提供高吞吐（NVLink + RDMA）与低延迟（纯 RDMA）两套通信内核，兼顾大批量训练与实时推理场景。支持 NVLink 和 RDMA 的节点内 / 跨节点通信。提供 SM 数量控制接口，可在计算与通信之间灵活分配 GPU 资源。集成可以重叠通信和计算的 hook 机制，允许在解码时后台并行接收数据，不占用任何 SM ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

夜雨旅游 · 探秘西域|南疆大环线12日旅行

6 月前

舰大官人 · 私信本舰询问任何专业问题，一概收费。天下没有免费的午餐。本舰的私-20241009122101

5 月前

都市时报 · 重铸热土：云南中烟在施甸县的10年

4 月前

蔻享学术 · 【直播】湖大刘全慧教授《概率论沉思录》第5章：概率论的怪异应用

3 月前

心榜 · 新手咨询进阶6个实用方法丨建议收藏

1 周前