专栏名称: 京东科技技术说
京东科技官方技术公众号,传递最佳实践&技术创新。
目录
相关文章推荐
今天看啥  ›  专栏  ›  京东科技技术说

🧐 DeepSeek-R1原理解析及项目实践(含小白向概念解读)

京东科技技术说  · 公众号  ·  · 2025-02-13 10:58
    

文章预览

一、概念解读(小白向) 我们打开deepseek官网,会发现对话框之下:有两个按钮,那他们的含义如何理解🤔?最近爆火的deepseek究竟指的是哪个模型?深度思考R1与联网搜索的作用?   接下来对常用概念做一些入门性质的介绍: 1、联网搜索: 比较好理解,我们知道LLM(大语言模型)的知识是有时效性的,因为大模型知识来源于海量的离线数据训练,而一般来说,其训练数据大约滞后于其发布时间半年到一年以上。比如在 OpenAI 的模型介绍网页上,可以看到 o1 模型的训练数据截止时间为2023年十月份,而deepseek(此处指V3基座),参考其回复发现时间大约也是2023年10月。【所以对于时效性问题,LLM回答不出来实属正常。】而联网搜索,解决的就是时效性问题,当你勾选联网搜索时,你可以把其视为一个能理解你的任意自然语言问题(传统搜索引擎 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览