文章预览
本文关注DeepSeek-R1在技术上最重要的突破——用纯深度学习的方法让AI自发涌现出推理能力。这一研究可能会对模型推理训练后续的范式产生深刻影响。 来源 | 腾讯科技 作者 | 郝博阳 编辑 | 郑可君 时隔不到一个月,DeepSeek又一次震动全球AI圈。 去年 12 月,DeepSeek推出的DeepSeek-V3在全球AI领域掀起了巨大的波澜,它以极低的训练成本,实现了与GPT-4o和Claude Sonnet 3.5等顶尖模型相媲美的性能,震惊了业界。 和上次不同的是,这次推出的新模型DeepSeek-R1不仅成本低,更是在技术上有了大福提升。 而且,它还是一个开源模型。 这款新模型延续了其高性价比的优势,仅用十分之一的成本就达到了GPT-o1级别的表现。 所以,很多业内人士甚至喊出了“DeepSeek接班OpenAI”的口号。 比如,前Meta AI工作人员、知名AI论文推特作者Elvis就强调,DeepSeek-R1的论文堪称瑰宝
………………………………