9.11比9.9大？多个大模型答错，业内人士：就是偏科，文科强理科弱；OpenJDK 计划要求限制 JNI 的使用

程序员头条 · 公众号 · · 2024-07-18 10:24

文章预览

0、9.11比9.9大？多个大模型答错，业内人士：就是偏科，文科强理科弱近日，“9.11和9.9哪个大”的问题引发热议，一一测试了ChatGPT以及目前国内的主流大模型，包括阿里、百度等5家大厂模型，月之暗面等6家AI独角兽的模型之后，得出的结果是：阿里通义千问、百度文心一言、Minimax和腾讯元宝4家大模型答对，其他8家则答错，错法各有不同。对此，有网友表示：“没眼看……“9.11和9.9哪个大”这样简单的问题，居然把主流大模型都难倒了？” 大模型这一算术问题最开始被艾伦研究机构(Allen Institute)成员林禹臣发现，他在 𝕏 平台上发布的截图显示，ChatGPT-4o在回答中认为13.11比13.8更大。“一方面AI越来越擅长做数学奥赛题，但另一方面常识依旧很难。”他表示。另有业内人士表示，目前来看大模型的数理能力相对较差的情况在中外都是一样的，“ ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

青云说说 · 青云早学习12/17，不知道什么会导致“成功”。但知道是什么导致“不成功”：不停抱怨+永久的受害人心态。

昨天

青云说说 · 青云早学习12/17，不知道什么会导致“成功”。但知道是什么导致“不成功”：不停抱怨+永久的受害人心态。

昨天

为你读诗 · 龙袍凤冠、金簪步摇、锦衣华服一书揽尽7000年穿搭美学

3 天前

当代 · 直播预告 | 马伯庸×走走×蔡骏×小饭：在现实与幻想的裂隙间，重新书写上海

4 天前

为你读诗 · 等待冬雪落，就让它替我们见面吧

5 天前

锂电江湖 · 【JH-7139】汽车：智能车，向未来（39页）

5 月前

创投家 · 一家特立独行的VC，募资30亿

5 月前