国产大模型竞技场首超GPT-4o！

人工智能与算法学习 · 公众号 · · 2024-10-17 19:59

文章预览

来源：量子位国产大模型首次在公开榜单上超过GPT-4o！就在刚刚，“大模型六小强”之一的零一万物正式对外发布新旗舰模型—— Yi-Lightning （闪电）。在大模型竞技场（Chatbot Arena）上，Yi-Lightning性能直冲总榜单并列第 6 ，数学分榜并列第3，代码等其它分榜也名列前茅。总成绩几乎与马斯克最新xAI大模型Grok-2-08-13持平，超越GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet等顶流。同时，国内清华系大模型公司智谱AI的 GLM-4-Plus 也杀进了总榜，位居第9 位。该榜单结果来自全球累积超千万次的人类用户盲测投票。前段时间大模型竞技场还刚刚更新了规则，新榜单对AI回答的长度和风格等特征做了降权处理，分数更能反映模型真正解决问题的能力。这次Yi-Lightning杀出重围，Lmsys团队特意发帖子，称这是竞技场上的大新闻：大模型竞技场总榜第 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博