一个从大三就接触NLP的小小NLPer,本公众号每天记录自己的一点一滴,每篇文章最后也有托福单词等新知识,学技术同时,也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇!
今天看啥  ›  专栏  ›  深度学习自然语言处理

DeepSeek 推理模型预览版上线,解密 o1 推理过程

深度学习自然语言处理  · 公众号  ·  · 2024-11-20 22:49

文章预览

今天,DeepSeek 全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。 所有用户均可登录官方网页 ( chat.deepseek.com) ,一键开启与 R1-Lite 预览版模型的超强推理对话体验。 DeepSeek R1 系列模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。 该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。 全面提升的推理性能 DeepSeek-R1-Lite 预览版模型在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权威评测中,均取得了卓越的成绩,大幅超越了 GPT-4o 等知名模型。 下表为 DeepSeek-R1-Lite 在各项相关评测中的得分结果: 深度思考的效果与潜力 DeepSeek-R1-Lite 的推理过程长,并且包含了大量的反思和验证。下图展示了模型在数 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览