DeepSeek 发布类似OpenAI o1的推理模型：DeepSeek R1

人工智能与算法学习 · 公众号 · · 2025-01-20 18:26

文章预览

来源：NLP工程化 DeepSeek 发布类似OpenAI o1的推理模型：DeepSeek R1。 DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。官方宣称该模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果。 DeepSeek-R1-Lite 预览版模型在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评测中，大幅超越了 GPT4o，甚至o1-preview 等知名模型。 DeepSeek-R1-Lite 目前仍处于迭代开发阶段，仅支持网页使用，暂不支持 API 调用。 DeepSeek-R1-Lite 所使用的也是一个较小的基座模型，无法完全释放长思维链的潜力。正式版 DeepSeek-R1 模型将完全开源。参考文献： [1] https://chat.deepseek.com/ [2] https://api-docs.deepseek.com/news/news1120 ·················END················· 分享收藏 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博