今天看啥  ›  专栏  ›  调研纪要

Deepseek开源周专家解读

调研纪要  · 公众号  ·  · 2025-03-02 23:46
    

文章预览

2.24-2.28,Deepseek陆续开源了五个与AI infra相关的项目,主要涉及其在模型效率优化方面的进展。周六,Deepseek官方发布了更为详细的推理系统介绍,特别值得注意的是,文章首次公开了Deepseek的理论成本、利润率等关键信息。 本次电话会主题围绕过去一周Deepseek开源项目,今晚我们邀请了国内大模型领域的专家进行解读。             专家: 首先,我会回顾Deepseek本周开源项目,然后对这些项目的特点进行简要介绍,并分析它们对行业上下游以及公司可能产生的影响。  一、开源项目介绍 在这一周的开源发布中,Deepseek主要推出了针对NVIDIA Hopper GPU硬件架构特性和新一代MOE模型架构的优化和设计。MOE模型是Deepseek的核心架构之一。我们可以将本次开源的项目分为三大类:数据准备、模型训练和模型推理优化。             1、数据准备环节: 3FS:这 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览