文章预览
机器之心报道 编辑:佳琪、蛋酱 DeepSeek 又出手了,这次又是重磅炸弹。 昨晚, DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview ,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。 在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权威评测中,DeepSeek-R1-Lite-Preview 模型已经 大幅超越了 GPT-4o 等顶尖模型,有三项成绩还领先于 OpenAI o1-preview 。 背后的秘诀,就是「 深度思考 」。 更多的强化学习、原生的思维链、更长的推理时间,能让大模型的性能更强,这在领域内已经是广泛共识。这种模式其实非常像人类大脑的深度思考。 与 OpenAI o1 有点不一样的是,DeepSeek-R1-Lite-Preview 会在回复中展示「思路链」推理,也就是响应查询和输入的不同链或「思路」,并解释它在做什么以及为什么这样做。 就像是解题时,有人喜
………………………………