「DeepSeek接班OpenAI」，最新开源的R1推理模型，让AI圈爆了

机器之心 · 公众号 · AI · 2025-01-21 10:48

主要观点总结

DeepSeek发布大模型DeepSeek-R1，在多个任务上表现出与OpenAI o1相当的推理能力。使用多阶段循环训练，大规模强化学习等技术。发布了两个小模型DeepSeek-R1-Zero和DeepSeek-R1 API服务。其训练技术和论文完全开源，并且模型性能优秀，展现出显著性价比。相比DeepSeek-R1的系列进化还包括提高语言可读性，自我进化能力和解决数学推理能力等。

关键观点总结

关键观点1: DeepSeek发布大模型DeepSeek-R1

具有全面的数学、代码和多模态推理能力，与OpenAI o1相当。

关键观点2: 使用多阶段循环训练方式

通过基础→RL→微调→RL→微调→RL的训练流程实现模型的优化。

关键观点3: 大规模使用强化学习技术

在后训练阶段大规模使用强化学习，提高了模型的推理能力。

关键观点4: DeepSeek-R1系列模型开源

包括DeepSeek-R1-Zero和DeepSeek-R1等模型完全开源，旨在回馈开源社区。

关键观点5: DeepSeek-R1 API服务性价比高

相比OpenAI的o1 API服务，DeepSeek具有极高的性价比。

关键观点6: 创新技术包括冷启动数据的使用和推理导向的强化学习

通过收集冷启动数据和使用推理导向的强化学习，提高了模型的推理能力和可读性。

关键观点7: 模型性能优秀且具备自我进化能力

DeepSeek-R1系列模型展现出显著的自我进化能力，在多个基准测试中表现出优秀的性能。

文章预览

机器之心报道机器之心编辑部 OpenAI 的最初愿景，最终被一家国内创业公司实现了？昨晚，大模型领域再次「热闹起来」，月之暗面发布在数学、代码、多模态推理能力层面全面对标 OpenAI 的满血版 o1 的多模态思考模型 K1.5 。而最近大热的 DeepSeek 正式推出了 DeepSeek-R1，同样在数学、代码和自然语言推理等任务上比肩 OpenAI o1 正式版。去年 12 月开源的大模型 DeepSeek-V3 刚刚掀起了一阵热潮，实现了诸多的不可能。这次开源的 R1 大模型则在一开始就让一众 AI 研究者感到「震惊」，人们纷纷在猜测这是如何做到的。 AutoAWQ 作者 Casper Hansen 表示，DeepSeek-R1 使用一种多阶段循环的训练方式：基础→ RL →微调→ RL →微调→ RL。 UC Berkeley 教授 Alex Dimakis 则认为 DeepSeek 现在已经处于领先位置，美国公司可能需要迎头赶上了。目前，DeepSeek 在网页端、App 端和 A ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博