专栏名称: IT报
聚焦IT、互联网、数码等行业新闻,致力于提供最鲜活的IT产业资讯,第一时间报道行业重大事件。以独特视角、犀利风格揭示IT产业走向,众多IT大佬都关注了!你还在等啥呢?投稿或合作请加V yeqw01 或Q 1945507743
今天看啥  ›  专栏  ›  IT报

DeepSeek代码开源周:重构AI大模型世界的游戏规则

IT报  · 公众号  ·  · 2025-03-01 21:48
    

文章预览

| I | T | 报 |  聚焦IT.互联网.通信.数码揭示科技潮流最新走向 【微信号:ITnewspaper】 在刚刚过去的五天里,AI领域发生了一场 quiet revolution(静悄悄的革命)。AI公司DeepSeek的“代码开源周”落下帷幕,每一天都为我们带来了新的开源代码库,让我们一探究竟。 Flash MLA:英伟达Hopper GPU的得力助手 DeepSeek首先开源了Flash MLA,这是一个专门为英伟达Hopper GPU优化的MLA(Multi-head Latent Attention,多头潜注意力)解码内核。它的出现,让大模型训练和推理过程中的内存占用大大减少。 Flash MLA的核心特性包括针对可变长度序列的优化,以及与CUDA 12.3及以上版本、PyTorch 2.0及以上版本的兼容性。在H800 SXM5平台上,它的性能更是达到了惊人的高度。 DeepEP通信库:MoE模型的加速器 紧接着,DeepSeek开源了DeepEP通信库,这是一个用于MoE(混合专家)模型训练和推理的EP(Exper ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览