专栏名称: 大侠学Python
我们或许是在学宇宙第一热门语言Python吧!大家都在学Python,大侠和大家一起分享Python资料、Python文章、Python工具资源、Python源码、Python教程,会Python的人生就跟开了挂一样
今天看啥  ›  专栏  ›  大侠学Python

大模型集体失智!9.11比9.9大?全员翻车!

大侠学Python  · 公众号  ·  · 2024-07-20 11:20

文章预览

来源丨量子位 前段时间,阿里巴巴数学竞赛中姜萍的事件闹得沸沸扬扬,很多人也让AI尝试挑战这些竞赛题,虽然表现还是不够看,但也能看出来,AI 对于数据库里已有的题目,还是发挥不错的。 不过,近日有人发现,各大 AI 大模型居然在小学生都会的简单数学常识中接连翻车。 这个问题就是,9.11 和 9.9 谁大? 对于人们心目中的天花板 GPT-4 和 GPT-4o,回答丝毫不拖泥带水: 9.11居然比9.9大!我们再看看 Gemini Advanced 的回答: 好的,又是斩钉截铁的给出了一个错误答案。再看到,Claude 3.5 Sonnet 并不像前两位那样直接给出了错误答案,而是开始分析: 分析了一通,拆开还是对的,怎么到了答案,又拉垮了... 经过测试,各大国产大模型也没有幸免于难。 Kimi: ChatGLM: 通义: 元宝: 豆包: 不过令人意外的是,免费版本的百度文心 3.5,居然保持了清醒, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览