今天看啥  ›  专栏  ›  赛道掘金

Deepseek专家交流反馈

赛道掘金  · 公众号  · AI 科技自媒体  · 2025-02-13 16:30
    

主要观点总结

本文讨论了模型应用、算力、国产芯片及模型发展等内容。指出模型推理生意与云计算相似,国内模型在云上做推理不经济,需要降低单次推理成本。Deepseek降低了训练成本,但推理算力成本降低不明显。国产芯片存在产能、良率和性价比等问题,但逐步得到互联网公司的广泛测试适配。国产模型发展需关注算力、数据、团队和商业化。Deepseek模型关注度提升,V3版本模型训练效率较高。文中强调了数据的重要性,并提醒投资者本文内容仅供学习交流,不构成任何投资建议。

关键观点总结

关键观点1: 模型应用与推理需求

指出模型推理生意与云计算相似,国产芯片适配推理需求问题不大,但稳定性相对较弱。国内模型在云上做推理不经济,需要降低单次推理成本。

关键观点2: Deepseek训练与推理成本

Deepseek降低了训练成本,但推理算力成本降低不明显。未来国内模型厂商需要蒸馏大模型成小模型以降低成本。

关键观点3: 国产芯片的发展与问题

国产芯片存在产能、良率和性价比等问题,但互联网公司正在广泛测试适配。政府支持国产芯片的发展。

关键观点4: 国产模型的发展趋势

国产模型发展需关注算力、数据、团队和商业化。训练需求大于推理需求,国产卡推理为主,文本、图片、语音和视觉同步开发。

关键观点5: Deepseek模型的发展与市场关注度

Deepseek模型市场关注度提升,V3版本使用更高的效率进行模型训练。强调数据的重要性,并提醒投资者本文不构成任何投资建议。


文章预览

25年是模型应用落地大年 25年年底推理所用算力才能赶上训练使用的算力 国产算力芯片跟进需要时间,但是目前国产芯片适配推理需求问题不大,只不过目前稳定性相对弱一些 模型推理的生意比较像云计算,云计算规模上来可以跟上游服务器压价;模型推理也是重资产投入, Deepseek 的官网价格可能没有利润, 国内模型在云上做推理一直不经济,模型能力弱,价格非常低,赚不到钱,对模型蒸馏能力有要求,不能提供特别大的模型,降低单次推理成本,模型参数越少,推理成本越低 Deepseek大幅降低了训练成本,但是推理算力成本降低不明显; 未来国内模型厂商需要蒸馏,把600B模型调优到300B上线运行,把大模型蒸馏成小模型有成本 国产芯片:存在产能,良率和性价比各种各样问题,历史上毫无性价比;现在互联网公司广泛测试适配,选择好的使用 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览