今天看啥  ›  专栏  ›  独角兽情报

DeepSeek表现对算力需求到底有无影响

独角兽情报  · 公众号  ·  · 2025-01-05 22:32
    

文章预览

独角兽智库 产业研究第一智库 独角兽投研情报群招募 独角兽智库发展至今,历时 9 年,积累了大量资源,也和顶尖投研资源形成了利益共同体,并经过今年近一年的产品测试,小范围会员服务近两年。 十一月精准把握住了 固态电池、AI+ 等板块机会,个股 桂发祥、华胜天成、供销大集 等 现开放体验名额,加微信 :itouzi8888, 文末有二维码 1、DeepSeek v3训练成本分析 整体训练成本较低:DeepSeek v3大模型整体训练成本约为557.6万美元,远低于其他同类大模型。训练阶段分为预训练、上下文拓展、后训练三个阶段,通过详细计算各阶段GPU小时耗费,加总得到总训练时间约为278.8万GPU小时,假设H800 GPU租用价格每小时2美元得出该成本。 实际成本可能更高:DeepSeek v3的技术文档中模型训练成本未包含模型架构设计、算法优化或数据处理等前期研究以及消融 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览