专栏名称: AI科技评论
点评学术,服务 AI !
今天看啥  ›  专栏  ›  AI科技评论

新王登基,Gemini 1.5 Pro 再度更新,超越 GPT 4o 和 Claude-3.5

AI科技评论  · 公众号  ·  · 2024-08-03 12:25

文章预览

这次不卷模型大小,只卷性能。 作者丨刘洁 编辑丨岑峰 lmsys官方在推特发布一则消息,恭喜DeepMind研发的Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名登顶,超越GPT 4o和Claude-3.5夺得第一。 这是继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来,OpenAI第二次让出Chatbot Arena的Overall ranking宝座。( 正如我们前天说的,越来越多的大模型向OpenAI发起了冲击 ) Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena测试一周后。获得了超过12,000个社区投票,在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的好成绩。之前说GPT-4o有刷分技巧,现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。 Gemini 1.5 Pro 实验版(0801)不仅在综合表现上极为突出,在各个细分领域上也有着出色的表现。它在数学方面排名前三,指令遵循排名前二,编码排名前五,硬提示(英语)排名前五 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览