国产大模型竞技场首超GPT-4o！零一万物GLM共同跻身Top10

量子位 · 公众号 · AI · 2024-10-16 13:36

主要观点总结

国产大模型首次在公开榜单上超过GPT-4，零一万物发布新旗舰模型Yi-Lightning，位列大模型竞技场总榜第六，并且在中文能力上名列前位。该模型采用MoE混合专家模型架构，具有推理速度快、生成质量高等特点。同时，团队还发布了AI2.0数字人方案，并接入了Yi-Lightning，实现了更自然实时的互动效果。

关键观点总结

关键观点1: Yi-Lightning模型发布及成绩

Yi-Lightning是零一万物发布的新旗舰模型，在大模型竞技场上取得优异成绩，总分几乎与马斯克最新xAI大模型Grok-2-08-13持平，超越GPT-4o系列等顶流模型。

关键观点2: Yi-Lightning的技术特点

Yi-Lightning采用MoE混合专家模型架构，具有优化混合注意力机制、跨层注意力、动态Top-P路由机制等技术特点，保证了处理长序列数据的高性能表现，同时降低了推理成本。

关键观点3: Yi-Lightning的性价比优势

Yi-Lightning在价格上相比国外顶尖模型具有明显优势，每百万token只需0.99元，同时保证了高性能和高质量，实现了高性价比。

关键观点4: 零一万物发布AI2.0数字人方案

零一万物首发了AI2.0数字人方案，该方案已接入Yi-Lightning，实现了更自然实时的互动效果。

关键观点5: 国产大模型与国外顶尖模型的差距

李开复博士表示，国产大模型跟硅谷最顶尖模型的差距缩小到了五个月，但追赶仍需要付出巨大努力和采取独特策略。

文章预览

西风发自凹非寺量子位 | 公众号 QbitAI 国产大模型首次在公开榜单上超过GPT-4o！就在刚刚，“大模型六小强”之一的零一万物正式对外发布新旗舰模型—— Yi-Lightning （闪电）。在大模型竞技场（Chatbot Arena）上，Yi-Lightning性能直冲总榜单并列第 6 ，数学分榜并列第3，代码等其它分榜也名列前茅。总成绩几乎与马斯克最新xAI大模型Grok-2-08-13持平，超越GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet等顶流。同时，国内清华系大模型公司智谱AI的 GLM-4-Plus 也杀进了总榜，位居第9 位。该榜单结果来自全球累积超千万次的人类用户盲测投票。前段时间大模型竞技场还刚刚更新了规则，新榜单对AI回答的长度和风格等特征做了降权处理，分数更能反映模型真正解决问题的能力。这次Yi-Lightning杀出重围，Lmsys团队特意发帖子，称这是竞技场上的大新 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博