今天看啥  ›  专栏  ›  无人之路

【AI启示录】2025 w09:过春天 - 用Deep Research读懂DeepSeek开源周都说了啥

无人之路  · 公众号  ·  · 2025-03-02 18:18
    

文章预览

前接 【AI启示录】2025 w05:开工利是🧧 - 春节长假后你要补齐的DeepSeek信息差 。 本周是DeepSeek开源周,DeepSeek一口气开源了: FlashMLA (高效注意力解码) DeepEP (MoE/专家并行通信库) DeepGEMM (FP8通用矩阵乘法库) DualPipe (双向管道并行算法) EPLB (专家并行负载平衡器) 3FS (高性能分布式文件系统) One More Thing 对于一个对LLM训练和推理技术系统了解不多的外行,想要理解这些项目的作用和分量,是一件困难的事情。还好,这周ChatGPT的 Deep Research (深入研究)功能对我开放,它能帮我在感兴趣的主题上做系统深入的调研,形成便于理解的调研报告。于是,在它的帮助下,我开始对本来很难看懂的DeepSeek硬核开源项目们有了一些了解。 1. LLM训练和推理的基本流程 为了理解这些项目的作用,有必要对LLM的训练和推理过程有个基本的理解。 LLM(大语 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览