谷歌终于赢了OpenAI一回：实验版本Gemini 1.5 Pro超越GPT-4o

机器学习研究组订阅 · 公众号 · AI · 2024-08-02 19:12

文章预览

这么强的模型，谷歌给大家免费试用。近两日，谷歌在不断发布最新研究。继昨日放出最强端侧 Gemma 2 2B 小模型后，刚刚，Gemini 1.5 Pro 实验版本 (0801) 已经推出。用户可以通过 Google AI Studio 和 Gemini API 进行测试和反馈。既然免费，那我们帮大家测试一下最近比较火的比大小问题。当我们问 Gemini 1.5 Pro (0801) 9.9 和 9.11 哪个数大时，模型一次就能回答正确，并给出了理由。当我们继续追问「Strawberry 单词里面有多少个 r」时，然而 Gemini 1.5 Pro (0801) 却翻车了。在提示语中施加「咒语」一步一步来，模型分析到第四步就出错了。 Google AI Studio 测试地址：https://aistudio.google.com/app/prompts/new_chat 不过，从官方评测来看，Gemini 1.5 Pro (0801) 各项指标还是很能打的。新模型迅速夺得著名的 LMSYS Chatbot Arena 排行榜榜首，并拥有令人印象深刻的 ELO 分数，得分为 1300。这 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

黄建同学 · Windsurf 官方发布了一个 Demo 项目，教大家如何使用-20241125120346

15 小时前

爱可可-爱生活 · 【密歇根大学工程数学笔记：为工程师准备的实用数学参考手册，包含大-20241125083522

19 小时前

爱可可-爱生活 · 【AutoFlow：开源的图谱型对话知识库工具，基于TiDB矢量-20241123155448

2 天前

机器之心 · 这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct

2 天前

宝玉xp · 可以试试 AI 帮你做，推荐试试 v0.dev or bolt.-20241120084728

5 天前