文章预览
来源:深度求索 今天,我们正式发布 DeepSeek-R1,并同步开源模型权重。 DeepSeek-R1 遵循 MIT License ,允许用户通过蒸馏技术借助 R1 训练其他模型。 DeepSeek-R1 上线API, 对用户开放思维链输出 ,通过设置 `model='deepseek-reasoner'` 即可调用。 DeepSeek 官网与 App 即日起同步更新上线。 性能对齐OpenAI-o1正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。 在此,我们将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。 论文链接 : https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf 蒸馏小模型超越 OpenAI o1-mini 我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模
………………………………