文章预览
(原版音频已上传知识星球内,可对照查看) Q:大家晚上好,今天汇报的主题是deep seek对全球AI算力的影响,为什么说这是大家最关注的内容呢? A:因为这和很多人的持仓有关系,尤其是对算力的影响最为直接,而且在这方面存在的分歧也是最大的。从目前能看到的情况来讲,在模型能力或者说执行模型能力上所需要的算力成本是在降低的。大家很关注这种降低对整体算力需求会产生什么样的影响,这里面涉及到预训练环节(free training)、后训练(post train)以及推理这三大环节的需求变化。在整个算力需求的演化过程中,会出现几个拐点。其中一个是整个算力需求的重心,会从前训练开始往后训练转移,这个拐点一定会出现。 Q:为什么说算力需求重心从前训练往后训练转移这个拐点一定会出现,且以欧系模型发布为代表呢? A:以GPT系列模型
………………………………