专栏名称: AINLPer
一个专注自然语言处理(NLP)方向的公众号。机器学习(ML)、深度学习(DL)、自然语言处理相关模型理解、热门论文(Paper)分享分析、pytorch、C++、Python、Java ...
今天看啥  ›  专栏  ›  AINLPer

开源!有了22万条DeepSeek R1的高质量数据,你也能复现DeepSeek了!

AINLPer  · 公众号  ·  · 2025-02-11 22:58
    

文章预览

点击上方 “ AINLPer “ ,设为 星标 更多干货,第一时间送达 DeepSeek 在海内外搅起的惊涛巨浪,余波仍在汹涌。 当中国大模型撕开硅谷的防线之后,在预设中总是落后半拍的中国 AI 军团,这次竟完成了一次反向技术输出,引发了全球范围内复现 DeepSeek 的热潮。 DeepSeek-R1 虽然开源,但也没有完全开源,训练数据、训练脚本等关键信息并未完全公布。 不过,有技术报告,相当于拥有着复现 R1 的指导方针,已经有不少执行力强的团队用小模型见证「 aha moment 」了。在浩浩荡荡的复刻大军中,最令人瞩目的,当数 Hugging Face 领衔的 Open R1 项目。 Open R1 宣称要做到完全开放复现 DeepSeek-R1,补齐 DeepSeek 所有未公开的技术细节。Open R1 项目刚刚启动不过几周,他们已经完成了: GRPO 实现 训练与评估代码 用于合成数据的生成器 项目地址:https://github.com/huggingface ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览