注册登录

专栏名称: 机器学习算法工程师

机器学习、深度学习、数据挖掘等人工智能领域的技术实战干货文章，这里都有！分享从业经验是我们的不变的准则……

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

数据派THU · GraphTeam: ... · 23 小时前

時間的玩家TimeIsArt · 每日临在 | 2025.02.02 · 2 天前

InfoTech · 10个超级实用的deepseek提示方式 · 3 天前

玉树芝兰 · 能反思的 AI ... · 3 天前

今天看啥 › 专栏 › 机器学习算法工程师

跳过2，OpenAI拿出了o3，可能突破LLM的局限性！

机器学习算法工程师 · 公众号 · · 2024-12-21 08:54

文章预览

⇧ 点蓝色字关注 “AI小小将” 今晚，OpenAI在12天直播的最后一天发布了新的推理模型 o3 ，o3是OpenAI的o1模型的进一步的升级，之所以跳过2，不是因为o2失败了，据说是因为o2这个名字已经被其他组织使用了。而且这次并不是o3的正式发布，只是o3模型的预告，以及给出o3模型的一些早期评估。据OpenAI的研究员所说，o1是第一个基于强化学习训练的大型推理模型，而o3进一步扩展了（scaling）强化学习，模型效果提升非常显著。首先，o3在编程方面比上一个版本o1有明显提升。在两个编程竞赛（ Codeforces和SWE-bench Verified ）的测试基准上o3有显著的优势。o3 在真实世界编程基准SWE-bench Verified上实现了71.7%的准确率，比o1高出20%。而o3在 Codeforces上的得分已经达到了2727 ELO，在全球排名中名列第175位，这已经超过了网站中的99.9%的人类选手。感觉按照o系列模型 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

数据派THU · GraphTeam: 基于多智能体协作的图分析大模型，平均准确率提升了 25.85%！！

23 小时前

時間的玩家TimeIsArt · 每日临在 | 2025.02.02

2 天前

InfoTech · 10个超级实用的deepseek提示方式

3 天前

玉树芝兰 · 能反思的 AI 搜索应用，如何帮你克服「写作障碍」？

3 天前

环保之家 · 环评中PM2.5排放速率按 PM10的50%计算，有环境部文件资料明确依据？

1 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号