文章预览
图片来源:由无界AI生成 What??? 一直低调行事的国内初创公司,旗下模型悄悄地跃升成国内第一、世界第五(仅排在o1系列和Claude 3.5之后)! 而且是前十名中的唯一一家国产公司。 (该榜上国产第二名是阿里开源的qwen2.5-72b-instruct,总榜第13)。 而且它登上的这个排行榜LiveBench,虽然现在还没有大模型竞技场(LMSYS Chatboat Arena)那么广为人知,但资格杠杠的—— 图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun),联合纽约大学等在今年6月推出。 号称是“全球首个无法作弊的LLM基准测试”。 而这次冷不丁杀出来的黑马,其实比较熟悉国内大模型竞争格局的朋友们已经猜到了—— Step系列,背后是大模型六小虎之一的阶跃星辰。 指令跟随高分拿下全球第一 在LiveBench榜单上,阶跃星辰自研的万亿参数语言大模型Step-2-16k-202411在Global Average上拿下57.68
………………………………