专栏名称: 甲子光年
甲子光年是一家科技智库,包含智库、媒体、社群、企业服务版块,立足于中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,致力于推动人工智能、大数据、物联网、云计算、信息安全、金融科技、大健康等科技创新在产业之中的应用与落地。
今天看啥  ›  专栏  ›  甲子光年

登上“最不可能作弊”的榜单,阶跃星辰Step-2位列中国大模型第一|甲子光年

甲子光年  · 公众号  ·  · 2024-11-20 22:23
    

文章预览

在“最难AI榜”,拿下中国第一、全球第五。 作者|王艺 ‍ ‍ ‍ 编辑|栗子 ‍ ‍ ‍ 11月19日,国际权威榜单LiveBench官网公布了最新的语言大模型测评结果:作为唯一进入前十名的中国公司,阶跃星辰自研的万亿参数语言大模型 Step-2-16k-202411(下文简称Step-2)位列全球第五,成绩逼近OpenAI的o1-mini-2024-09-12,超越 gpt-4o-2024-08-06、gemini-1.5-pro-002等国际主流模型,是表现最佳的中国基座大模型。 图源: LiveBench官网 根据榜单, Step-2在IF Average(Instruction Following)一项表现突出,超越包括 o1-preview-2024-09-12 在内的所有国内外语言大模型 。 在AI届, LiveBench榜单一直以严苛的标准被人称为“最难AI榜”。而在国内AI“六小强”中阶跃星辰一直以技术实力强和低调著称,此次登顶LiveBench榜单中国第一,也掀开了这家大模型创业公司的神秘面纱。 1.最权威榜单的最 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览