专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源,网友:今年编程只剩Tab键

量子位  · 公众号  · AI  · 2025-01-19 11:42
    

主要观点总结

文章介绍了DeepSeek的AI推理大模型的新进展。DeepSeek-R1-Preview版本使用了更大的基础模型,在LiveCodeBench上的表现与OpenAI o1相当。此外,文章还提到了其他国产大模型的更新和OpenAI的新模型o3-mini的进展。

关键观点总结

关键观点1: DeepSeek-R1-Preview的新进展

DeepSeek的新模型DeepSeek-R1-Preview使用了更大的基础模型。它在LiveCodeBench上的表现与OpenAI o1相当,表现出强大的编程能力。

关键观点2: 其他国产大模型的更新

国内其他大模型团队也在春节期间进行了模型更新,包括MiniMax开源4M超长上下文新模型等。

关键观点3: OpenAI的新模型o3-mini的进展

OpenAI的o3-mini模型完成了外部合作测试,已确定最终版,将在几周内推出。该模型速度很快,但大多数情况下不如o1-pro。


文章预览

梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek版o1 ,有消息了。 还未正式发布,已在代码基准测试 LiveCodeBench霸榜前三 ,表现 与OpenAI o1的中档推理设置相当 。 注意了,这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview (轻量预览版) 。 而是摘掉了轻量版的帽子,称为 DeepSeek-R1-Preview (预览版) ,意味着 替换了规模更大的基础模型 。 LiveCodeBench团队透露,他们正在与DeepSeek合作评估新模型的能力,在合作过程中,DeepSeek团队还帮他们找出并解决了评分系统的一些bug。 与此同时,他们还晒出了目前仅有的一张DeepSeek-R1-Preview的思考过程。 鉴于DeepSeek此前已宣布R1模型将开源,有网友表示,与OpenAI o1编程能力相当的开源模型即将发布,2025年的编程就只剩下按Tab键了。 DeepSeek推理大模型满血版 两个月前,DeepSeek在官网上线DeepSeek-R1-Lite-Preview时 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览