新王登基，Gemini 1.5 Pro 再度更新，超越 GPT 4o 和 Claude-3.5

AI科技评论 · 公众号 · · 2024-08-03 12:25

文章预览

这次不卷模型大小，只卷性能。作者丨刘洁编辑丨岑峰 lmsys官方在推特发布一则消息，恭喜DeepMind研发的Gemini 1.5 Pro 实验版（0801）在Chatbot Arena排名登顶，超越GPT 4o和Claude-3.5夺得第一。这是继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来，OpenAI第二次让出Chatbot Arena的Overall ranking宝座。（正如我们前天说的，越来越多的大模型向OpenAI发起了冲击） Gemini 1.5 Pro 实验版（0801）在Chatbot Arena测试一周后。获得了超过12，000个社区投票，在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的好成绩。之前说GPT-4o有刷分技巧，现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。 Gemini 1.5 Pro 实验版（0801）不仅在综合表现上极为突出，在各个细分领域上也有着出色的表现。它在数学方面排名前三，指令遵循排名前二，编码排名前五，硬提示（英语）排名前五 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

高校人才网V · 中国科学技术大学诚邀海内外英才加盟

3 天前

手游那点事 · 拿版号20天后突然神秘现身：好家伙，又是腾讯？

4 天前

覃塘数智乡村 · 第十一届覃塘区荷花节系列活动丨清风荷韵·梦回秦汉大型历史穿越主题系列活动，体验一场古风穿越之旅！

4 月前

人工智能学派 · 智能汽车专题：从小鹏、理想、蔚来布局，看自动驾驶发展趋势

3 月前

直通IPO · 募资310亿港元！近三年港股最大IPO诞生

2 月前

小米汽车 · 今天，#小米SU7# 第100,000台正式下线！仅用230天，-20241113104450

1 周前