文章预览
原文: https://zhuanlan.zhihu.com/p/24906803874 自 DeepSeek-R1 发布以来,迅速风靡全球,如今已晋升为国民级产品。此后,全球范围内掀起了一股复现 DeepSeek-R1 的热潮,其中不乏一些亮点纷呈的优秀项目。本文将对这些开源项目中的亮点复现工作进行汇总。 一、DeepSeek-R1 复现汇总 下面是最新的 DeepSeek-R1 复现汇总: 接下来我们介绍下复现细节。 二、Open R1: HuggingFace 复现 DeepSeek-R1 全流程 Open R1 项目由 HuggingFace 发起,联合创始人兼 CEO Clem Delangue 是这么说的: 这个项目的目的是构建 R1 pipeline 中缺失的部分,以便所有人都能在此之上复制和构建 R1。 HuggingFace 表示,将以 DeepSeek-R1 的技术报告为指导,分 3 个步骤完成这个项目: • step 1:从 DeepSeek-R1 中蒸馏高质量数据,复现 R1-Distill 模型。 • step 2:复现通过纯强化学习训练 R1-Zero 的过程,包括如何生成推
………………………………