文章预览
DeepSeek很强,但作业难抄。 甲子光年(jazzyear)原创 作者 | 赵健 编辑 | 栗子 在全民接入DeepSeek的热潮下,第一个有关大模型的冷思考出现了。 2月9日,潞晨科技创始人尤洋在社交媒体发表了一条“暴论”:MaaS (Model as a Service) 在中国短时间内可能是最差的商业模式。 尤洋通过计算得出,现阶段通过token计费所获得的收入远远不足以覆盖大模型的算力成本。“如果满血版的DeepSeek R1每日输出1000亿Token,那么每月的机器成本是4.5亿,亏损约4亿”,“用户越多,亏损越多”。 一石激起千层浪,月亏损4亿这一数字引发了对于MaaS商业模式的巨大争议。 硅基流动创始人袁进辉在朋友圈回应称,关于4.5亿的成本估算是过于夸张的,原因是使用了错误的架构进行的估计。 什么才是正确的架构?其实就藏在DeepSeek的官方论文里——一个“MLA+DeepSeek MoE+专家并行”
………………………………