文章预览
2025-02-03 08:19
本条微博链接
以下是从推理模型(例如 @deepseek_ai R1, @Alibaba_Qwen QwQ 或 @GoogleDeepMind Flash 思维)中提炼出的 7 个推理数据集: 1 ⃣ ServiceNow-AI/R1-Distill-SFT:从 9 个不同源数据集的 DeepSeek-R1-Distill-Qwen-32B 中提取出的 1.7M 个样本(尚未过滤)。 2 ⃣ open-thoughts/OpenThoughts-114k:从 Deepseek R1 中提取的有关数学、科学、代码和谜题的 114k 个样本。 3 ⃣ bespokelabs/Bespoke-Stratos-17k:从 Deepseek R1 中提取的 17k 个样本耗时 1.5 小
………………………………