文章预览
自一月以来, DeepSeek 在 AI 领域引发了极大的热度,也出现了大量分析文章。其中来自 Leonis Capital 于 2.6 发表于 Substack 上的文章:「DeepSeek: A Technical and Strategic Analysis for VCs and Startups」 (原文:https://leonisnewsletter.substack.com/p/deepseek-a-technical-and-strategic) 无疑是我读到最为深度的一篇文章 - 不仅深入剖析了 DeepSeek 在技术架构上的创新,如其独特 MoE 架构、MLA 机制,等;还详细解读了 DeepSeek 在强化学习方面的革新,以及通过模型蒸馏技术实现 AI 民主化,和其对于整个AI生态(模型厂商、硬件厂商、应用层)的深远影响,特别是在成本大幅下降的环境下下,对于新势力初创公司的重大机遇。 注:技术解读和成本分析的部分在之前关于 DeepSeek 的文章里多次聊到,这些内容就放在了文章结尾。 我们建了个DeepSeek R1 开发者交流群,切身聊一聊,今天创业,
………………………………