【NLP】LLM排行榜更新！谷歌Bard超过GPT-4，中国玩家未进前十

机器学习初学者 · 公众号 · · 2024-01-27 17:49

文章预览

‍ 夕小瑶科技说原创作者 | 王二狗今天谷歌Bard的排名在Imsys的LLMs 排位赛上超过了GPT-4,直接跃居第二名（但没有超过OpenAI最新的 GPT-4 Turbo模型）: 遇到这好事，谷歌首席科学家 Jeff Dean 当然是第一时间前来“炫耀”，并给自家的 Gemini Pro模型带货。排行榜介绍这个LLMs 排行榜（Chatbot Arena基准平台）是由 UC伯克利研究人员主导的LMSYS (Large Model Systems Organization)组织发起的。通过在LLMs 间进行随机匿名的 1V1 battle 方式，并基于 Elo 评级系统得出排名。如下图所示，你可以随便问一个问题，左侧是模型A的回答，右侧是模型B的回答。然后你可以给这两个模型的回答打分，一共有四个选项「A更好；B更好；A和B一样好；A和B一样差」，如果一轮聊天判断不出来，你可以继续聊天，直到选出你认为更好的，但如果在聊天过程中暴露了大模型的身份，则投票将 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博