专栏名称: 斌叔OKmath
橙旭园CEO 教育博主 教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。
今天看啥  ›  专栏  ›  斌叔OKmath

以下是从推理模型(例如@deepseek_ai R1, @Ali-20250203081929

斌叔OKmath  · 微博  ·  · 2025-02-03 08:19
    

文章预览

2025-02-03 08:19 本条微博链接 以下是从推理模型(例如 @deepseek_ai R1, @Alibaba_Qwen QwQ 或 @GoogleDeepMind Flash 思维)中提炼出的 7 个推理数据集: 1 ⃣ ServiceNow-AI/R1-Distill-SFT:从 9 个不同源数据集的 DeepSeek-R1-Distill-Qwen-32B 中提取出的 1.7M 个样本(尚未过滤)。 2 ⃣ open-thoughts/OpenThoughts-114k:从 Deepseek R1 中提取的有关数学、科学、代码和谜题的 114k 个样本。 3 ⃣ bespokelabs/Bespoke-Stratos-17k:从 Deepseek R1 中提取的 17k 个样本耗时 1.5 小 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览