以下是从推理模型（例如@deepseek_ai R1， @Ali-20250203081929

斌叔OKmath · 微博 · · 2025-02-03 08:19

文章预览

2025-02-03 08:19 本条微博链接以下是从推理模型（例如 @deepseek_ai R1， @Alibaba_Qwen QwQ 或 @GoogleDeepMind Flash 思维）中提炼出的 7 个推理数据集： 1 ⃣ ServiceNow-AI/R1-Distill-SFT：从 9 个不同源数据集的 DeepSeek-R1-Distill-Qwen-32B 中提取出的 1.7M 个样本（尚未过滤）。 2 ⃣ open-thoughts/OpenThoughts-114k：从 Deepseek R1 中提取的有关数学、科学、代码和谜题的 114k 个样本。 3 ⃣ bespokelabs/Bespoke-Stratos-17k：从 Deepseek R1 中提取的 17k 个样本耗时 1.5 小 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

中国中医 · 【新春佳节防流感中医专家有办法（五）】中医适宜技术如何治疗流感？

昨天

中国中医 · 【健康养生】今日立春，阳气上升，顺时养生要注意这几点~

昨天

中国中医 · 央视《朝闻天下》| 立春节气怎样保护肝脏？这些误区务必绕行

2 天前

张小北 · 怪兽电影还得是传统物理特效看着才有感觉//@黄小Q是甜栗:真的很-20240813235203

5 月前