专栏名称: 第一财经
第一财经官方公众号,致力为广大投资者打造最权威的财经信息平台,同时,努力成为第一财经忠实用户的交流平台。
今天看啥  ›  专栏  ›  第一财经

DeepSeek知乎发文:理论利润率达545%!

第一财经  · 公众号  · 财经  · 2025-03-01 13:24
    

主要观点总结

DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》一文,首次揭示其模型推理系统的优化细节及成本利润率。文章介绍了如何通过大规模跨节点专家并行技术实现更大的吞吐和更低的延迟,并详细披露了DeepSeek的理论成本和利润计算方式。

关键观点总结

关键观点1: DeepSeek-V3/R1推理系统的优化目标

通过大规模跨节点专家并行技术,旨在实现更大的吞吐量和更低的延迟。

关键观点2: 使用EP增长批量大小(batch size)和隐藏传输耗时的方法

文章介绍了如何通过专家并行技术优化系统,进而提升批量处理能力,并有效隐藏传输耗时。

关键观点3: 负载均衡的实现

为实现优化目标,DeepSeek采取了负载均衡的策略,但未具体展开细节。

关键观点4: DeepSeek的成本和利润披露

文章率先披露了DeepSeek的理论成本和利润率等关键信息,包括GPU租赁成本和理论上的总收入计算。


文章预览

3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。 文章写道:“DeepSeek-V3 / R1 推理系统的优化目标是:更大的吞吐,更低的延迟。”为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。 文章还率先披露了DeepSeek的理论成本和利润率等关键信息。“假定GPU租赁成本为2美金/小时,总成本为$87,072/天。……如果所有 tokens全部按照DeepSeek R1的定价计算, 理论上一天的总收入为$562,027,成本利润率545% 。”(一财科技) ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览