专栏名称: Python爱好者社区
人生苦短,我用Python。分享Python相关的技术文章、工具资源、精选课程、视频教程、热点资讯、学习资料等。每天自动更新和推送。
今天看啥  ›  专栏  ›  Python爱好者社区

大模型集体失智!9.11比9.9大?全员翻车!

Python爱好者社区  · 公众号  · Python  · 2024-07-19 15:00

文章预览

转自:量子位 前段时间,阿里巴巴数学竞赛中姜萍的事件闹得沸沸扬扬,很多人也让AI尝试挑战这些竞赛题,虽然表现还是不够看,但也能看出来,AI 对于数据库里已有的题目,还是发挥不错的。 不过,近日有人发现,各大 AI 大模型居然在小学生都会的简单数学常识中接连翻车。 这个问题就是,9.11 和 9.9 谁大? 对于人们心目中的天花板 GPT-4 和 GPT-4o,回答丝毫不拖泥带水: 9.11居然比9.9大!我们再看看 Gemini Advanced 的回答: 好的,又是斩钉截铁的给出了一个错误答案。再看到,Claude 3.5 Sonnet 并不像前两位那样直接给出了错误答案,而是开始分析: 分析了一通,拆开还是对的,怎么到了答案,又拉垮了... 经过测试,各大国产大模型也没有幸免于难。 Kimi: ChatGLM: 通义: 元宝: 豆包: 不过令人意外的是,免费版本的百度文心 3.5,居然保持了清醒, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览