Deepseek大模型推理算法其实很简单

科学大院 · 公众号 · · 2025-02-09 07:00

文章预览

本篇文章正文共10819字预计阅读时间约为30分钟人们听说大模型已经有两年多了，不少人自己测试了对话。但舆论对于大模型还是有很多误解，应用时摸不清特性，一不小心就上当，更不知道大模型是怎么开发出来的。性能顶级的Deepseek火爆开源之后，意想不到的事发生了，人们居然很简单地就把大模型部署用上了！一个朋友，在3000多元的联想lecoo酷310 PC机上，就安装Deepseek R1成功了。机器配置不高，装的是7B（70亿）参数的版本，聊天能力明显差很多。性能最强的是671B的版本，需要高一些的配置，但PC机完全可行，国外有人6000美元的机器上装成了。首先要知道，大模型开发有两种场景，难度高的是训练，难度低的是推理（inference），人们熟悉的也是推理。训练的成果就是“权重”，能生成性能从高到低的几个版本，权重文件从大到小。有了权 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博