专栏名称: 前沿科技学习分享圈

这里汇聚了人工智能领域奋战在第一线的创业者和投资人，不同研究方向有不同的讨论小组，包括AI虚拟伴侣、AI情感咨询、人形机器人、文生视频、文生音乐、开源AI硬件等等，如果你也对这些领域感兴趣，欢迎加入！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

OpenAI o1全方位SOTA登顶lmsys排行榜！数学能力碾压Claude和谷歌模型，o1-mini并列第一

前沿科技学习分享圈 · 公众号 · · 2024-09-20 23:34

文章预览

经过一周的激烈角逐，OpenAI的o1模型在lmsys排行榜上取得了显著的成绩。同时，为了满足公众对模型性能的好奇心，OpenAI公开了o1在测评中使用的所有代码。备受期待的OpenAI o1模型在lmsys的测评中表现出色。不出所料，o1-preview在各个领域均取得了领先地位，超越了GPT-4o的最新版本，在数学、复杂提示和编程领域尤为突出；而o1-mini，尽管名字中有“mini”，却也与GPT-4o并列综合排名第二，同样在复杂提示、编程、数学等领域登顶。 lmsys社区官方在社交平台上表示，这项测试结果是基于6k+社区投票得出的，并将OpenAI的这一成就描述为“难以置信的里程碑”。 o1-preview在所有模型中的胜率均超过50%，尤其是与04-09版GPT-4-Turbo的对比中，胜率达到了88%。 o1-mini在与o1-preview的对决中胜率为46%，与09-03版GPT-4o的对决中胜率为48%，显示出两者实力相当。值得注意的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博