主要观点总结
本文介绍了DeepSeek开源项目的最新进展,包括模型优化、开源代码发布、效率提升等方面,并讨论了国内外模型大厂的不同发展路径。同时,提供了对相关产业链标的梳理和风险提示。
关键观点总结
关键观点1: DeepSeek连续6天开源Infra层的核心代码
涉及MLA、通信-计算、矩阵乘法运算、专家负载、文件存取等模块的优化,旨在提高模型本身和硬件的效率,且国产GPU适配进展顺利。
关键观点2: DeepSeek开源项目的优化效果
若将Web、APP和API的所有用户请求均以R1定价计费,则每日总收入为562,027美元,成本利润率为545%。考虑V3定价、夜间打折等因素,优化效果明显,成本利润率有望达到108%。
关键观点3: 全球模型的训练和推理效率有望提升
DeepSeek的代码开源为技术报告中的算法分析提供了代码实现,降低了技术复现的难度,许多优化方法可被借鉴到其他模型的训练中。
关键观点4: 国内外模型大厂的发展路径分化
海外模型大厂仍追求大算力边界突破,而国内则更强调软硬件效率优化。DeepSeek的迭代重点可能在于软硬件和算法的持续优化。
关键观点5: 产业链相关标的梳理和风险提示
DeepSeek的持续迭代对模型成本和效率的优化具有显著影响,推荐关注有用户、数据、场景优势的公司。同时,提醒注意宏观经济波动和技术进步不及预期的风险。
文章预览
点击小程序查看研报原文 核心观点 2月24日起DeepSeek连续6天开源,在之前放出的模型参数、技术报告基础上,再次发布了Infra层的核心代码,涉及MLA、通信-计算、矩阵乘法运算、专家负载、文件存取等模块优化,旨在提高模型本身和硬件的效率,且国产GPU适配进展顺利。据DeepSeek数据,若将Web、APP和API的所有用户请求均以R1定价计费,则每日总收入将为562,027美元,成本利润率为545%。若考虑V3定价、夜间打折等因素,付费token占比50%情况下我们测算成本利润率有望达到108%,优化效果明显。我们认为,模型层的持续优化,有望持续降低应用层成本、提高应用表现。建议关注2B和2C应用中拥有用户、数据和场景优势的公司。 DeepSeek在原先开源的基础上,再次开源Infra核心代码 此前DeepSeek在核心的V3/R1模型上,已经开源了模型权重,使得全球用户均可自行下载
………………………………