推理性能直逼o1，DeepSeek再次出手，重点：即将开源

机器之心 · 公众号 · AI · 2024-11-21 12:41

文章预览

机器之心报道编辑：佳琪、蛋酱 DeepSeek 又出手了，这次又是重磅炸弹。昨晚， DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview ，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评测中，DeepSeek-R1-Lite-Preview 模型已经大幅超越了 GPT-4o 等顶尖模型，有三项成绩还领先于 OpenAI o1-preview 。背后的秘诀，就是「深度思考」。更多的强化学习、原生的思维链、更长的推理时间，能让大模型的性能更强，这在领域内已经是广泛共识。这种模式其实非常像人类大脑的深度思考。与 OpenAI o1 有点不一样的是，DeepSeek-R1-Lite-Preview 会在回复中展示「思路链」推理，也就是响应查询和输入的不同链或「思路」，并解释它在做什么以及为什么这样做。就像是解题时，有人喜 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · [CL]《Counterfactual Generation f-20241118060432

3 天前

量子位 · 打破纪录！中国科学家让薛定谔的猫活了23分钟

4 天前

中国人工智能学会 · 聚智促产兴教育才，2024第十三届中国智能产业高峰论坛暨中国人工智能学院院长与名师论坛在杭开幕

5 天前

宝玉xp · →_→//@翼尖小翅:学车最好还是手动挡“//@宝玉xp:这个我-20241116042327

5 天前

宝玉xp · 作为一个资深并且日常大量用 AI 写代码程序员的忠告：是时候抛弃-20241115130609

6 天前

丁香公开课 · 骨密度看 T值，小于 -2.5 就是骨松？错！你要先搞清楚这 4 点

4 月前