专栏名称: 吃果冻不吐果冻皮
专注于AI工程化(LLM、MLOps、LLMOps、RAG、Agent)落地。
目录
相关文章推荐
今天看啥  ›  专栏  ›  吃果冻不吐果冻皮

开源社区 DeepSeek R1 最新复现进展汇总

吃果冻不吐果冻皮  · 公众号  ·  · 2025-02-22 10:06
    

文章预览

原文: https://zhuanlan.zhihu.com/p/24906803874      自 DeepSeek-R1 发布以来,迅速风靡全球,如今已晋升为国民级产品。此后,全球范围内掀起了一股复现 DeepSeek-R1 的热潮,其中不乏一些亮点纷呈的优秀项目。本文将对这些开源项目中的亮点复现工作进行汇总。 一、DeepSeek-R1 复现汇总 下面是最新的 DeepSeek-R1 复现汇总: 接下来我们介绍下复现细节。 二、Open R1: HuggingFace 复现 DeepSeek-R1 全流程 Open R1 项目由 HuggingFace 发起,联合创始人兼 CEO Clem Delangue 是这么说的: 这个项目的目的是构建 R1 pipeline 中缺失的部分,以便所有人都能在此之上复制和构建 R1。 HuggingFace 表示,将以 DeepSeek-R1 的技术报告为指导,分 3 个步骤完成这个项目: • step 1:从 DeepSeek-R1 中蒸馏高质量数据,复现 R1-Distill 模型。 • step 2:复现通过纯强化学习训练 R1-Zero 的过程,包括如何生成推 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览