专栏名称: 扩展迷EXTFANS
发现有趣的网站,玩转Chrome扩展,尽在Extfans
目录
相关文章推荐
电池cbu  ·  LG 新能源:为 Bear ... ·  1 周前  
今天看啥  ›  专栏  ›  扩展迷EXTFANS

大模型集体失智!9.11和9.9哪个大,几乎全翻车了

扩展迷EXTFANS  · 公众号  ·  · 2024-07-17 18:48

文章预览

梦晨 一水 发自 凹非寺 量子位 | 公众号 QbitAI 没眼看…… “9.11和9.9哪个大” 这样简单的问题,居然把主流大模型都难倒了?? 强如 GPT-4o ,都坚定地认为9.11更大。 谷歌Gemini Advanced付费版 ,同样的口径。 新王 Claude 3.5 Sonnet ,还一本正经的给出离谱的计算方法。 9.11 = 9 + 1/10 + 1/100 9.9 = 9 + 9/10 到这一步还是对的,但下一步突然就不讲道理了 如上所示,9.11比9.90大0.01。 你想让我进一步详细解释小数的比较吗? 这你还解释啥啊解释,简直要怀疑是全世界AI联合起来欺骗人类了。 艾伦AI研究所成员林禹臣换了个数字测试,GPT-4o依旧翻车,他表示: 一方面AI越来越擅长做数学奥赛题,但另一方面 常识依旧很难 。 也有网友发现了华点, 如果是说软件版本号,那么9.11版本确实比9.9版本更大 (更新)。 而AI都是软件工程师开发的,所以…… 那么,究竟是怎 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览