专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10

量子位  · 公众号  · AI  · 2024-10-16 13:36

主要观点总结

国产大模型首次在公开榜单上超过GPT-4,零一万物发布新旗舰模型Yi-Lightning,位列大模型竞技场总榜第六,并且在中文能力上名列前位。该模型采用MoE混合专家模型架构,具有推理速度快、生成质量高等特点。同时,团队还发布了AI2.0数字人方案,并接入了Yi-Lightning,实现了更自然实时的互动效果。

关键观点总结

关键观点1: Yi-Lightning模型发布及成绩

Yi-Lightning是零一万物发布的新旗舰模型,在大模型竞技场上取得优异成绩,总分几乎与马斯克最新xAI大模型Grok-2-08-13持平,超越GPT-4o系列等顶流模型。

关键观点2: Yi-Lightning的技术特点

Yi-Lightning采用MoE混合专家模型架构,具有优化混合注意力机制、跨层注意力、动态Top-P路由机制等技术特点,保证了处理长序列数据的高性能表现,同时降低了推理成本。

关键观点3: Yi-Lightning的性价比优势

Yi-Lightning在价格上相比国外顶尖模型具有明显优势,每百万token只需0.99元,同时保证了高性能和高质量,实现了高性价比。

关键观点4: 零一万物发布AI2.0数字人方案

零一万物首发了AI2.0数字人方案,该方案已接入Yi-Lightning,实现了更自然实时的互动效果。

关键观点5: 国产大模型与国外顶尖模型的差距

李开复博士表示,国产大模型跟硅谷最顶尖模型的差距缩小到了五个月,但追赶仍需要付出巨大努力和采取独特策略。


文章预览

西风 发自 凹非寺 量子位 | 公众号 QbitAI 国产大模型 首次在公开榜单上超过GPT-4o! 就在刚刚,“大模型六小强”之一的零一万物正式对外发布新旗舰模型—— Yi-Lightning (闪电) 。 在大模型竞技场 (Chatbot Arena) 上,Yi-Lightning性能直冲总榜单并列 第 6 ,数学分榜并列第3,代码等其它分榜也名列前茅。 总成绩几乎与马斯克最新xAI大模型Grok-2-08-13持平,超越GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet等顶流。 同时,国内清华系大模型公司智谱AI的 GLM-4-Plus 也杀进了总榜,位居 第9 位。 该榜单结果来自全球累积超千万次的人类用户盲测投票。 前段时间大模型竞技场还刚刚更新了规则,新榜单对AI回答的长度和风格等特征做了降权处理,分数更能反映模型真正解决问题的能力。 这次Yi-Lightning杀出重围,Lmsys团队特意发帖子,称这是竞技场上的大新 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览