专栏名称: 夕小瑶科技说
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
今天看啥  ›  专栏  ›  夕小瑶科技说

大模型集体失智!9.11和9.9哪个大,几乎全翻车了

夕小瑶科技说  · 公众号  ·  · 2024-07-16 15:26

文章预览

夕小瑶科技说 分享 来源 | 量子位 没眼看…… “9.11和9.9哪个大” 这样简单的问题,居然把主流大模型都难倒了?? 强如 GPT-4o ,都坚定地认为9.11更大。 谷歌Gemini Advanced付费版 ,同样的口径。 新王 Claude 3.5 Sonnet ,还一本正经的给出离谱的计算方法。 9.11 = 9 + 1/10 + 1/100 9.9 = 9 + 9/10 到这一步还是对的,但下一步突然就不讲道理了 如上所示,9.11比9.90大0.01。 你想让我进一步详细解释小数的比较吗? 这你还解释啥啊解释,简直要怀疑是全世界AI联合起来欺骗人类了。 艾伦AI研究所成员林禹臣换了个数字测试,GPT-4o依旧翻车,他表示: 一方面AI越来越擅长做数学奥赛题,但另一方面 常识依旧很难 。 也有网友发现了华点, 如果是说软件版本号,那么9.11版本确实比9.9版本更大 (更新)。而AI都是软件工程师开发的,所以…… 那么,究竟是怎么回事? 先 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览