今天看啥  ›  专栏  ›  大模型智能

开源中文DeepSeek-R1(满血)蒸馏数据集-110K

大模型智能  · 公众号  ·  · 2025-02-20 00:00
    

文章预览

大模型智能|分享 来源 | NLP工作站 作者 | 刘聪NLP 话不多说,先放数据下载链接。 HF: https://huggingface.co/datasets/Congliu/Chinese-DeepSeek-R1-Distill-data-110k MS: https://modelscope.cn/datasets/liucong/Chinese-DeepSeek-R1-Distill-data-110k 该数据集为中文开源蒸馏满血R1的数据集,数据集中不仅包含math数据,还包括大量的通用类型数据,总数量为110K。 为什么开源这个数据? R1的效果十分强大,并且基于R1蒸馏数据SFT的小模型也展现出了强大的效果,但之前群里问,貌似中文数据较少,基本上开源的R1蒸馏数据集都是英文数据,或者是非满血蒸馏数据。 这不就来了嘛!!! 其实对于有机器人的人来说,其实110K数据蒸馏也蛮快的,但巧妇难为无米之炊,大多数人可能是没有那么多资源自己本地部署一个满血版R1,这也是为什么很多蒸馏数据用的32B、7B等进行蒸馏的原因。 开这个数据 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览