专栏名称: 凤凰网科技
这里可以看到新鲜出炉的科技产业新闻、深入浅出的企业市场分析,可以看到直击真相的科技事件图解、轻松逗比的科技人物吐槽,干货满满绝无水分。
今天看啥  ›  专栏  ›  凤凰网科技

大模型集体失智!9.11和9.9哪个大,几乎全翻车了

凤凰网科技  · 公众号  · 科技媒体  · 2024-07-16 21:34
    

文章预览

导语: GPT-4o、Claude 3.5都翻车,字节豆包亮了 来源|量子位(ID:QbitAI) 作者|梦晨 一水 没眼看…… “9.11和9.9哪个大” 这样简单的问题,居然把主流大模型都难倒了?? 强如 GPT-4o ,都坚定地认为9.11更大。 谷歌Gemini Advanced付费版 ,同样的口径。 新王 Claude 3.5 Sonnet ,还一本正经的给出离谱的计算方法。 9.11 = 9 + 1/10 + 1/100 9.9 = 9 + 9/10 到这一步还是对的,但下一步突然就不讲道理了 如上所示,9.11比9.90大0.01。 你想让我进一步详细解释小数的比较吗? 这你还解释啥啊解释,简直要怀疑是全世界AI联合起来欺骗人类了。 艾伦AI研究所成员林禹臣换了个数字测试,GPT-4o依旧翻车,他表示: 一方面AI越来越擅长做数学奥赛题,但另一方面 常识依旧很难。 也有网友发现了华点, 如果是说软件版本号,那么9.11版本确实比9.9版本更大(更新)。 而AI都是软 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览