专栏名称: 甲子光年

甲子光年是一家科技智库，包含智库、媒体、社群、企业服务版块，立足于中国科技创新前沿阵地，动态跟踪头部科技企业发展和传统产业技术升级案例，致力于推动人工智能、大数据、物联网、云计算、信息安全、金融科技、大健康等科技创新在产业之中的应用与落地。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

登上“最不可能作弊”的榜单，阶跃星辰Step-2位列中国大模型第一｜甲子光年

甲子光年 · 公众号 · · 2024-11-20 22:23

文章预览

在“最难AI榜”，拿下中国第一、全球第五。作者｜王艺 ‍ ‍ ‍ 编辑｜栗子 ‍ ‍ ‍ 11月19日，国际权威榜单LiveBench官网公布了最新的语言大模型测评结果：作为唯一进入前十名的中国公司，阶跃星辰自研的万亿参数语言大模型 Step-2-16k-202411（下文简称Step-2）位列全球第五，成绩逼近OpenAI的o1-mini-2024-09-12，超越 gpt-4o-2024-08-06、gemini-1.5-pro-002等国际主流模型，是表现最佳的中国基座大模型。图源： LiveBench官网根据榜单， Step-2在IF Average（Instruction Following）一项表现突出，超越包括 o1-preview-2024-09-12 在内的所有国内外语言大模型。在AI届， LiveBench榜单一直以严苛的标准被人称为“最难AI榜”。而在国内AI“六小强”中阶跃星辰一直以技术实力强和低调著称，此次登顶LiveBench榜单中国第一，也掀开了这家大模型创业公司的神秘面纱。 1.最权威榜单的最 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博