文章预览
来源:NLP工程化 DeepSeek 发布类似OpenAI o1的推理模型:DeepSeek R1。 DeepSeek R1 系列模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。 官方宣称该模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果。 DeepSeek-R1-Lite 预览版模型在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权威评测中,大幅超越了 GPT4o,甚至o1-preview 等知名模型。 DeepSeek-R1-Lite 目前仍处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。 DeepSeek-R1-Lite 所使用的也是一个较小的基座模型,无法完全释放长思维链的潜力。 正式版 DeepSeek-R1 模型将完全开源。 参考文献: [1] https://chat.deepseek.com/ [2] https://api-docs.deepseek.com/news/news1120 ·················END················· 分享 收藏
………………………………