DeepSeek-R1 发布，性能对标 OpenAI o1 正式版

AI数字世界 · 公众号 · · 2025-01-21 15:00

文章预览

来源：深度求索今天，我们正式发布 DeepSeek-R1，并同步开源模型权重。 DeepSeek-R1 遵循 MIT License ，允许用户通过蒸馏技术借助 R1 训练其他模型。 DeepSeek-R1 上线API，对用户开放思维链输出，通过设置 `model='deepseek-reasoner'` 即可调用。 DeepSeek 官网与 App 即日起同步更新上线。性能对齐OpenAI-o1正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。在此，我们将 DeepSeek-R1 训练技术全部公开，以期促进技术社区的充分交流与创新协作。论文链接： https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf 蒸馏小模型超越 OpenAI o1-mini 我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时，通过 DeepSeek-R1 的输出，蒸馏了 6 个小模 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

志公教育 · 涨知识！花呗逾期，会影响公务员政审！

8 月前

新浪财经 · 债台高筑、频繁“押错宝”……又一家储能巨头面临崩盘？ | 能见派

6 月前

武汉清风 · 揭开享乐奢靡“隐身衣” | 隔空送礼

4 月前

Supreme情报网 · ‼️被买手刷屏、溢价！「PP吐司服」怎么一夜成为了"现象级"爆款？

1 月前

中国证券报 · 新华社经济随笔：以好“钱景”助力企业奔向好“前景”

1 周前