文章预览
来源:量子位 国产大模型 首次在公开榜单上超过GPT-4o! 就在刚刚,“大模型六小强”之一的零一万物正式对外发布新旗舰模型—— Yi-Lightning (闪电) 。 在大模型竞技场 (Chatbot Arena) 上,Yi-Lightning性能直冲总榜单并列 第 6 ,数学分榜并列第3,代码等其它分榜也名列前茅。 总成绩几乎与马斯克最新xAI大模型Grok-2-08-13持平,超越GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet等顶流。 同时,国内清华系大模型公司智谱AI的 GLM-4-Plus 也杀进了总榜,位居 第9 位。 该榜单结果来自全球累积超千万次的人类用户盲测投票。 前段时间大模型竞技场还刚刚更新了规则,新榜单对AI回答的长度和风格等特征做了降权处理,分数更能反映模型真正解决问题的能力。 这次Yi-Lightning杀出重围,Lmsys团队特意发帖子,称这是竞技场上的大新闻: 大模型竞技场总榜第
………………………………