主要观点总结
本文主要讨论了DeepSeek作为AI应用的快速发展和影响力,以及与之相关的几个问题。DeepSeek在短时间内的DAU增长迅速,引发了关于需求、模型热点、算力供给等多个方面的讨论。
关键观点总结
关键观点1: DeepSeek成为全球DAU增速最快的AI应用,20天实现DAU 2000万。
文章介绍了DeepSeek的快速发展,并与其他应用如豆包的DAU增长进行了对比。
关键观点2: DeepSeek的推理需求远超预期,凸显了算力的挑战。
文章指出深度思考和联网模式不仅仅是技术问题,更多的是算力的挑战。国内算力资源存在结构性供需不平衡的问题。
关键观点3: 模型热点的不断切换和模型层的商品化趋势。
文章讨论了模型热点的切换和模型层的内卷现象,认为没有一家模型厂商可以在所有维度维持领先优势,模型层将在未来的切换成本将接近于零。
关键观点4: DeepSeek的开源对生态的影响以及AI商业价值的变化。
文章认为DeepSeek的开源策略是追赶闭源的重要信号,验证了模型层的商品化趋势。AI的商业价值正从模型层向上层转移,应用将会更加繁荣。
关键观点5: 关于豆包和DeepSeek的关系以及字节的战略布局。
文章强调了豆包和DeepSeek并非竞争关系,而是生态共荣。两者的战略聚焦有所不同,但互相促进。字节对模型和research的进展有强大的虹吸力,并享受向上层释放的商业价值。
文章预览
相信大家都看到那张图了, DeepSeek已经成为全球DAU增速最快的AI应用,用20天实现DAU 2000万 。要知道豆包是23年8月上线,DAU直到24年底才到了2000万(春节放假DAU略有盘整)。过年期间的最大赢家毫无疑问是DeepSeek 而这引申出来几个问题 1. 显然推理需求远远超过了DS自己的预期 。深度思考和联网模式不是所谓技术问题,就是算力不够用。这把算是让中国人民也能亲身体会什么叫test-time compute scaling law。时间越长,推理效果越高,相应的就是算力的无底洞。 供给如何?我们之前写过,国内算力资源结构性供需不平衡。 官方版本要DS自己拿算力承接,但内部即便是训练算力分配都不够。海外如微软、国内腾讯阿里云用自身算力去承接。而硅基流动这次找华为云,也是考虑到昇腾是国内三方可买到的扩展能力最强的国产卡(毕竟南方产能拿最多)。但另一
………………………………