专栏名称: 科学大院
中国科学院官方科普平台。前沿、权威、有趣、有料。
今天看啥  ›  专栏  ›  科学大院

Deepseek大模型推理算法其实很简单

科学大院  · 公众号  ·  · 2025-02-09 07:00
    

文章预览

本篇文章正文共10819字 预计阅读时间约为30分钟 人们听说大模型已经有两年多了,不少人自己测试了对话。但舆论对于大模型还是有很多误解,应用时摸不清特性,一不小心就上当,更不知道大模型是怎么开发出来的。 性能顶级的Deepseek火爆开源之后,意想不到的事发生了,人们居然很简单地就把大模型部署用上了! 一个朋友,在3000多元的联想lecoo酷310 PC机上,就安装Deepseek R1成功了。机器配置不高,装的是7B(70亿)参数的版本,聊天能力明显差很多。性能最强的是671B的版本,需要高一些的配置,但PC机完全可行,国外有人6000美元的机器上装成了。 首先要知道, 大模型开发有两种场景,难度高的是训练,难度低的是推理(inference), 人们熟悉的也是推理。训练的成果就是“权重”,能生成性能从高到低的几个版本,权重文件从大到小。 有了权 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览