这都不会！9.11比9.9大？大模型居然犯错！还敢用吗？

全球风口 · 公众号 · · 2024-07-23 06:36

文章预览

▲ 点击订阅，抓住风口你好，我是王煜全，这里是王煜全要闻评论。人工智能大模型，作为本轮科技革命的通用技术，被认为是这个时代的蒸汽机。但是，最近一道小学难度的数学题，却让各路大模型纷纷“栽了跟头”。 “9.11和9.9，哪个数字更大？”， GPT-4o、谷歌的Gemini、Claude 3.5居然全都给出了错误的答案，认为9.11更大。国内的一些大模型，如Kimi，哪怕给它多次的机会，仍然毫不犹豫地犯错。但是，文心一言、字节豆包、腾讯元宝、通义千问等国内模型却成功答对。这一常识性错误，最早是硅谷独角兽Scale AI的高级提示工程师Riley Goodside，在日常使用GPT-4o时偶然发现的。据推测，由于大模型以token方式解析文本，会将9.11拆分为“9”、“小数点”和“11”，11大于9，所以导致了错误。也有人说，书籍目录、软件版本号的数字排序习惯，也可 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

物业管理资讯平台 · 主下水管堵塞，楼上19户赔偿12万，物业无责不赔偿！

3 天前

物业管理资讯平台 · 在您指责物业、拒交物业费前，请先搞清楚这十个问题！

4 天前

药渡 · 有人一动就出汗，有人一点汗没有！出汗多好，还是少出汗好？

3 月前

青纳 · Adv Sci｜铁离子/紫草素纳米粒子嵌入型水凝胶：具有强黏附力和愈合功能的糖尿病口腔溃疡治疗新方案

1 月前

InfoQ · 不使用EC2或Kubernetes：看PostNL如何构建纯Serverless架构

3 周前