专栏名称: 学术头条
致力于科学传播和学术分享,关注计算机科学、认知科学、人工智能科学、神经科学、脑科学等学科领域。我们从跨学科的角度,围绕“认知智能”向科学界和大众介绍相关领域的前沿话题和深度解读。
今天看啥  ›  专栏  ›  学术头条

OpenAI o1系列成色如何?SuperBench9月综合榜单揭晓

学术头条  · 公众号  ·  · 2024-10-02 08:24
    

文章预览

内容来自:清华大学人工智能研究院基础模型研究中心 进入2024年9月,全球大模型市场竞争加剧,OpenAI的o1系列一经发布,便受到了业内广泛关注,国内各大厂商也纷纷推出了最新版本的大模型,值得关注的有智谱AI的GLM-4-Plus、通义千问的Qwen2.5-72B以及深度求索的DeepSeek-V2.5等。 为了更好地衡量国内外各家大模型能力,SuperBench团队最新发布了2024年9月版本的《SuperBench大模型综合能力评测报告》,在本次评测中,选取了24个海内外具有代表性的大模型,具体评测列表如下: 评测总结 本报告只展示总榜和各分榜排名前十的模型,若您想查看完整榜单,请联系我们。 总榜单 根据本次的评测结果,我们得出以下几个主要结论: 整体来说,国外模型在本次评测中继续保持领先地位,OpenAI最新推出的 o1-preview 和 o1-mini 表现强势,刷新了多个榜单的最高分数, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览