专栏名称: 哎咆科技
原「果粉查询」公众号蜕变为专注科技生活媒体,提供最前沿科技动态及爆料,产品试用测评&众筹,苹果序列号查询,山寨机&翻新机验证等服务。
今天看啥  ›  专栏  ›  哎咆科技

AI挑战《超级马力欧兄弟》:GPT-4o 太菜了!

哎咆科技  · 公众号  · 硬件  · 2025-03-04 20:30
    

文章预览

上周五,加利福尼亚大学圣地亚哥分校的 Hao 人工智能实验室开展了一项别具一格的研究,他们把 AI 应用到经典游戏《超级马力欧兄弟》中,以此对 AI 性能展开测试。测试结果表明,Anthropic 的 Claude 3.7 展现出最为优异的表现,Claude 3.5 紧追其后,然而谷歌的 Gemini 1.5 Pro 以及 OpenAI 的 GPT-4o 表现欠佳。 此次实验并非采用 1985 年最初发行的游戏版本,而是借助实验室自主研发的 GamingAgent 框架,在模拟器里进行。GamingAgent 为 AI 提供基础指令和游戏截图,AI 则生成 Python 代码来控制马力欧。研究人员注意到,像 OpenAI 的 o1 这类推理模型,其表现比不上 “非推理” 模型,主要原因在于它们决定行动需要花费数秒时间,可在《超级马力欧兄弟》这款游戏里,时机的把握极为关键。 虽说游戏向来都是衡量 AI 性能的重要手段,不过部分专家对将游戏表现与技术 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览