专栏名称: AIGC新智界
区块链/数字货币/比特币中文资讯,创立于2011年,200多位专栏作入驻平台,国内最大区块链资讯原创基地(公众号【原创】认证),我们为以下合作伙伴供稿:火币、OKCoin、BTC.com、BTCC、币看、BTC123、比特时代、挖币网
今天看啥  ›  专栏  ›  AIGC新智界

国产模型指令跟随全球第一!来自LeCun亲推的「最难作弊」大模型新榜单

AIGC新智界  · 公众号  · 比特币  · 2024-11-22 17:25

文章预览

图片来源:由无界AI生成 What??? 一直低调行事的国内初创公司,旗下模型悄悄地跃升成国内第一、世界第五(仅排在o1系列和Claude 3.5之后)! 而且是前十名中的唯一一家国产公司。 (该榜上国产第二名是阿里开源的qwen2.5-72b-instruct,总榜第13)。 而且它登上的这个排行榜LiveBench,虽然现在还没有大模型竞技场(LMSYS Chatboat Arena)那么广为人知,但资格杠杠的—— 图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun),联合纽约大学等在今年6月推出。 号称是“全球首个无法作弊的LLM基准测试”。 而这次冷不丁杀出来的黑马,其实比较熟悉国内大模型竞争格局的朋友们已经猜到了—— Step系列,背后是大模型六小虎之一的阶跃星辰。 指令跟随高分拿下全球第一 在LiveBench榜单上,阶跃星辰自研的万亿参数语言大模型Step-2-16k-202411在Global Average上拿下57.68 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览