今天看啥  ›  专栏  ›  技术最前线

DeepSeek 四连炸!梁文峰参与开发

技术最前线  · 公众号  · 科技媒体  · 2025-02-27 16:48
    

文章预览

DeepSeek 开源周第四天 2 月 27 日是 DeepSeek “开源周”的第 4 天,DS 一下就 Open 了三个仓库:DualPipe、EPLB 和 Profiling Data。 DualPipe 从时间上优化了计算与通信的调度, EPLB 从空间上平衡利用计算资源, Profiling Data 则提供了前两者在实际应用中效果的可视化证据 并且在 DualPipe 的开发者中,就有 梁文峰 本人。 (一点也不意外.jpg) DS 开源周系列: 《 第一弹:DeepSeek 推出 FlashMLA 》 《 第二弹:DeepSeek 推出 DeepEP 》 《 第三弹:DeepSeek 推出 DeepGEMM 》 今日亮点 训练速度更快 :DualPipe 通过将计算和通信重叠,消除了空闲时间,就像接力赛中接力棒从未停止移动一样。以往拖沓的训练现在能更快完成。 成本节约 :通过更充分地利用每块 GPU,DeepSeek AI 声称与竞争对手相比,他们已将计算需求削减了高达 11 倍,仅使用 2,048 块 Nvidia H800 GPU,而无需更昂贵的配置。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览