专栏名称: 孔某人的低维认知
孔某人低维认知中世界的投影,世界很复杂,但人的认知总是过于简单。 ####关注领域:LLM技术及应用、认知科学、决策规划、机器学习、提升生产率的技术方案等。
今天看啥  ›  专栏  ›  孔某人的低维认知

对这轮DeepSeek高渗透率的归因

孔某人的低维认知  · 公众号  ·  · 2025-02-05 14:03
    

文章预览

好像没有看到跟我观点一致的内容,用OpenAI Deep Research搜了下也没有看到满意的回答,所以还是简略写一篇。 我也没有上帝视角,无法给出一个时间线回放,本文主要在分析原因,而不是传播的动力学过程。 1、过程回顾 1.1、大模型圈内 在我看来DeepSeek并没有做什么营销投入,可能也就是最初在自己的号上发布并开源了新模型。 最初是在大模型圈子内关注,原因有: 第一个大参数量(>100B)的开源的类o1模型实现。 公开了技术报告,并且让人觉得方法简单有效。并且有一些意想不到的顿悟时刻case。 很低的名义训练成本。 benchmark效果能够追齐当前前沿模型。 然后海外和大陆两边各自扩展,海外大模型圈子: DeepSeek直接在X上发文面向英语圈发布,并提供在海外可下载的模型权重。 海外惊讶于现在就有开源方案追上了o1,并且还是中国团队,并一个 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览