机器学习、深度学习、数据挖掘等人工智能领域的技术实战干货文章,这里都有!分享从业经验是我们的不变的准则……
今天看啥  ›  专栏  ›  机器学习算法工程师

跳过2,OpenAI拿出了o3,可能突破LLM的局限性!

机器学习算法工程师  · 公众号  ·  · 2024-12-21 08:54
    

文章预览

⇧ 点 蓝色 字关注 “AI小小将” 今晚,OpenAI在12天直播的最后一天发布了新的推理模型 o3 ,o3是OpenAI的o1模型的进一步的升级,之所以跳过2,不是因为o2失败了,据说是因为o2这个名字已经被其他组织使用了。而且这次并不是o3的正式发布,只是o3模型的预告,以及给出o3模型的一些早期评估。 据OpenAI的研究员所说,o1是第一个基于强化学习训练的大型推理模型,而o3进一步扩展了(scaling)强化学习,模型效果提升非常显著。 首先,o3在编程方面比上一个版本o1有明显提升。在两个编程竞赛( Codeforces和SWE-bench Verified )的测试基准上o3有显著的优势。o3 在真实世界编程基准SWE-bench Verified上实现了71.7%的准确率,比o1高出20%。 而o3在 Codeforces上的得分已经达到了2727 ELO,在全球排名中名列第175位,这已经超过了网站中的99.9%的人类选手。 感觉按照o系列模型 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览