深夜重磅！DeepSeek 新模型，多项指标超越 o1，即将全面开源

橘子汽水铺 · 公众号 · · 2024-11-20 20:54

文章预览

就在刚刚，DeepSeek 放出超重磅全新模型！模型名称：DeepSeek-R1-Lite 预览版新模型直接对标 OpenAI o1 在数学、代码、复杂逻辑推理方面，实际效果媲美 o1-preview 使用强化学习训练，推理过程包含大量反思和验证思维链可达上万字，并且不藏着掖着，全部为用户展示模型特色这是第一次，我们能看到思维链的实际效果，是不是很有意思？ DeepSeek R1 Lite 模型在 AIME 、 MATH、Codeforces 指标中，竟然还超过了 o1-preview DeepSeek-R1-Lite 的推理过程长，并且包含了大量的反思和验证。下图展示了模型在数学竞赛上的得分与测试所允许思考的长度紧密相关。红色实线展示了模型所能达到的准确率与所给定的推理长度呈正相关；相比传统的多次采样+投票（Majority Voting），模型思维链长度增加展现出了更高的效率。模型体验目前 DeepSeek-R1-Lite 模型已经上线到官网网 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博