DeepSeek新模型大揭秘，为何它能震动全球AI圈

经理人产业管理 · 公众号 · · 2025-02-05 16:54

文章预览

本文关注DeepSeek-R1在技术上最重要的突破——用纯深度学习的方法让AI自发涌现出推理能力。这一研究可能会对模型推理训练后续的范式产生深刻影响。来源 | 腾讯科技作者 | 郝博阳编辑 | 郑可君时隔不到一个月，DeepSeek又一次震动全球AI圈。去年 12 月，DeepSeek推出的DeepSeek-V3在全球AI领域掀起了巨大的波澜，它以极低的训练成本，实现了与GPT-4o和Claude Sonnet 3.5等顶尖模型相媲美的性能，震惊了业界。和上次不同的是，这次推出的新模型DeepSeek-R1不仅成本低，更是在技术上有了大福提升。而且，它还是一个开源模型。这款新模型延续了其高性价比的优势，仅用十分之一的成本就达到了GPT-o1级别的表现。所以，很多业内人士甚至喊出了“DeepSeek接班OpenAI”的口号。比如，前Meta AI工作人员、知名AI论文推特作者Elvis就强调，DeepSeek-R1的论文堪称瑰宝 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博