文章预览
就在刚刚,DeepSeek 放出超重磅全新模型! 模型名称:DeepSeek-R1-Lite 预览版 新模型直接对标 OpenAI o1 在数学、代码、复杂逻辑推理方面, 实际效果媲美 o1-preview 使用强化学习训练,推理过程包含大量反思和验证 思维链可达上万字 ,并且不藏着掖着,全部为用户展示 模型特色 这是第一次,我们能看到思维链的实际效果 ,是不是很有意思? DeepSeek R1 Lite 模型在 AIME 、 MATH、Codeforces 指标中,竟然还超过了 o1-preview DeepSeek-R1-Lite 的推理过程长,并且包含了大量的反思和验证。下图展示了模型在 数学竞赛上的得分与测试所允许思考的长度紧密相关。 红色实线展示了模型所能达到的准确率与所给定的推理长度呈正相关;相比传统的多次采样+投票(Majority Voting),模型思维链长度增加展现出了更高的效率。 模型体验 目前 DeepSeek-R1-Lite 模型已经上线到官网网
………………………………