主要观点总结
文章介绍了DeepSeek的AI推理大模型的新进展。DeepSeek-R1-Preview版本使用了更大的基础模型,在LiveCodeBench上的表现与OpenAI o1相当。此外,文章还提到了其他国产大模型的更新和OpenAI的新模型o3-mini的进展。
关键观点总结
关键观点1: DeepSeek-R1-Preview的新进展
DeepSeek的新模型DeepSeek-R1-Preview使用了更大的基础模型。它在LiveCodeBench上的表现与OpenAI o1相当,表现出强大的编程能力。
关键观点2: 其他国产大模型的更新
国内其他大模型团队也在春节期间进行了模型更新,包括MiniMax开源4M超长上下文新模型等。
关键观点3: OpenAI的新模型o3-mini的进展
OpenAI的o3-mini模型完成了外部合作测试,已确定最终版,将在几周内推出。该模型速度很快,但大多数情况下不如o1-pro。
文章预览
梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek版o1 ,有消息了。 还未正式发布,已在代码基准测试 LiveCodeBench霸榜前三 ,表现 与OpenAI o1的中档推理设置相当 。 注意了,这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview (轻量预览版) 。 而是摘掉了轻量版的帽子,称为 DeepSeek-R1-Preview (预览版) ,意味着 替换了规模更大的基础模型 。 LiveCodeBench团队透露,他们正在与DeepSeek合作评估新模型的能力,在合作过程中,DeepSeek团队还帮他们找出并解决了评分系统的一些bug。 与此同时,他们还晒出了目前仅有的一张DeepSeek-R1-Preview的思考过程。 鉴于DeepSeek此前已宣布R1模型将开源,有网友表示,与OpenAI o1编程能力相当的开源模型即将发布,2025年的编程就只剩下按Tab键了。 DeepSeek推理大模型满血版 两个月前,DeepSeek在官网上线DeepSeek-R1-Lite-Preview时
………………………………