人工智能产业链核心:基础技术、人工智能技术及人工智能应用。 服务机器人核心:芯片、操作系统、AI技术。 工业机器人核心:减速器、伺服机、控制器。 无人机核心:控制、环境感知、路径规划。 无人驾驶汽车核心计算机科学、模式识别、智能控制技术。
今天看啥  ›  专栏  ›  人工智能产业链union

【AI前沿】GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4

人工智能产业链union  · 公众号  ·  · 2024-05-20 20:20
    

文章预览

【导读】 OpenAI半小时的发布会让很多人第一反应是直呼「失望」,但随着官网放出更多demo以及更多网友开始试用,大家才发现GPT-4o真的不可小觑,不仅在各种基准测试中稳拿第一,而且有很多发布会从未提及的惊艳功能。 OpenAI在发布会上官宣GPT-4o之后,各路大神也开始了对这个新模型的测评,结果就是,GPT-4o在多项基准测试上都展现了SOTA的实力。 别家发布会都在画饼,OpanAI却总能开出一种「欲扬先抑」的效果,惊喜全在发布会之后。  基准测试结果 首先,在LMSys聊天机器人竞技场上的ELO分数排行上,GPT-4o套了一个GPT2聊天机器人的马甲,以一骑绝尘的态势名列第一,评分为1310,和第二名GPT-4-turbo的1253分相比,呈现断档式的提升。 再来看多模态领域的基准Reka Vibe-Eval,这也是一个很有挑战性的测试,由 269 个超高质量图像文本对组成,用于评估多 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览