文章预览
对标 OpenAI o1 正式版的国产大模型来了! 1 月 20 日晚,DeepSeek(深度求索)公司发布推理模型 DeepSeek-R1 正式版,同步开源模型权重,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。 网友热评:这,才是真正的OpenAI。 能力相当于一个月 200 美元的 ChatGPT o1 版本,却完全免费。 不止如此,DeepSeek 一同开源的还有「技术报告」,那些训练 R1 时踩过的坑、做过的事通通讲给你听,只为铺平 AGI 的路。 第一时间阅读这份技术报告后,英伟达高级研究科学家 Jim Fan 带来了新鲜解读,值得我们大声齐读: 「我们生活在这样一个时代:由非美国公司保持 OpenAI 最初的使命——做真正开放的前沿研究、为所有人赋能。这似乎讲不通,但戏剧性的往往最有可能发生。 DeepSeek-R1 不仅开源了大量模型,还泄露了所有训练秘密。他们可能是第一个显示 RL(强
………………………………