“DeepSeek接班OpenAI”，R1推理模型让AI圈爆了

虎嗅APP · 公众号 · 科技媒体 · 2025-01-21 17:47

文章预览

本文来自微信公众号：机器之心，原文标题：《“DeepSeek接班OpenAI”，最新开源的R1推理模型，让AI圈爆了》，头图来自：《硅谷》昨晚，大模型领域再次“热闹起来”，月之暗面发布在数学、代码、多模态推理能力层面全面对标 OpenAI 的满血版 o1 的多模态思考模型 K1.5。而最近大热的 DeepSeek 正式推出了 DeepSeek-R1，同样在数学、代码和自然语言推理等任务上比肩 OpenAI o1 正式版。去年 12 月开源的大模型 DeepSeek-V3 刚刚掀起了一阵热潮，实现了诸多的不可能。这次开源的 R1 大模型则在一开始就让一众 AI 研究者感到“震惊”，人们纷纷在猜测这是如何做到的。 AutoAWQ 作者 Casper Hansen 表示， DeepSeek-R1 使用一种多阶段循环的训练方式：基础→ RL →微调→ RL →微调→ RL。 UC Berkeley 教授 Alex Dimakis 则认为 DeepSeek 现在已经处于领先位置，美国公司可能需要迎 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博