理论成本利润率545%！DeepSeek知乎发文引业内震动

界面新闻 · 公众号 · 热门自媒体 · 2025-03-01 21:44

主要观点总结

DeepSeek官方发布《DeepSeek-V3/R1推理系统概览》，披露了其使用大规模跨节点专家并行技术优化推理系统的核心方案，并通过降低成本提高利润率至545%，引发业界震动。文章介绍了该推理系统的目标、实现方法、理论成本和利润率，并披露了相关数据和开源项目。

关键观点总结

关键观点1: DeepSeek-V3/R1推理系统的优化目标及实现方法

DeepSeek使用大规模跨节点专家并行技术，通过增大批量尺寸和提高图形处理器矩阵乘法的效率来提高吞吐，同时分散专家在不同的GPU上以降低延迟。

关键观点2: DeepSeek的理论成本和利润率

DeepSeek披露了在北京时间2月27日至2月28日期间，其推理服务的节点占用情况和理论成本及收入数据，成本利润率高达545%，刷新了全球AI大模型领域的盈利记录。

关键观点3: DeepSeek开源周的正式收官及开源项目

DeepSeek在知乎发布《概览》标志着全球关注的“DeepSeek开源周”正式收官，期间陆续开源了多个最新技术进展和代码库。

文章预览

图片来源：界面图库 3月1日，DeepSeek官方认证账号在知乎发布了《DeepSeek-V3/R1推理系统概览》(下称《概览》)一文，首次公布模型推理系统的核心优化方案，并披露理论成本利润率高达545%，刷新了全球AI大模型领域的盈利高点，引发业内震动。《概览》显示，DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟。为了实现上述两个目标，DeepSeek使用大规模跨节点专家并行(EP）。首先EP使得批量尺寸大大增加，从而提高图形处理器(GPU)矩阵乘法的效率，提高吞吐。其次 EP 使得专家分散在不同的 GPU上，每个GPU只需要计算很少的专家，因此更少的访存需求，从而降低延迟。 EP同时也增加了系统的复杂性。因此，《概览》就如何使用EP增大批量尺寸、如何隐藏传输的耗时、如何进行负载均衡等进行了讲解。 DeepSeek还披露了DeepSeek的理论成本和利润率等关 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博