专栏名称: 中国人工智能学会
关注中国人工智能学会官方公共账号,收取学会的科普信息、新闻动态、活动预告及人工智能领域科技前沿信息。
今天看啥  ›  专栏  ›  中国人工智能学会

热点关注丨大模型集体失智!9.11和9.9哪个大,几乎全翻车了

中国人工智能学会  · 公众号  · AI  · 2024-07-18 17:01

文章预览

转自 量子位 梦晨 一水 发自 凹非寺 量子位 | 公众号 QbitAI 没眼看…… “9.11和9.9哪个大” 这样简单的问题,居然把主流大模型都难倒了?? 强如 GPT-4o ,都坚定地认为9.11更大。 谷歌Gemini Advanced付费版 ,同样的口径。 新王 Claude 3.5 Sonnet ,还一本正经的给出离谱的计算方法。 9.11 = 9 + 1/10 + 1/100 9.9 = 9 + 9/10 到这一步还是对的,但下一步突然就不讲道理了 如上所示,9.11比9.90大0.01。 你想让我进一步详细解释小数的比较吗? 这你还解释啥啊解释,简直要怀疑是全世界AI联合起来欺骗人类了。 艾伦AI研究所成员林禹臣换了个数字测试,GPT-4o依旧翻车,他表示: 一方面AI越来越擅长做数学奥赛题,但另一方面 常识依旧很难 。 也有网友发现了华点, 如果是说软件版本号,那么9.11版本确实比9.9版本更大 (更新)。 而AI都是软件工程师开发的,所以…… 那 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览