专栏名称: AI算法与图像处理
考研逆袭985,非科班跨行AI,目前从事计算机视觉的工业和商业相关应用的工作。分享最新最前沿的科技,共同分享宝贵的资源资料,这里有机器学习,计算机视觉,Python等技术实战分享,也有考研,转行IT经验交流心得
今天看啥  ›  专栏  ›  AI算法与图像处理

大模型集体失智!9.11比9.9大?全员翻车!

AI算法与图像处理  · 公众号  ·  · 2024-07-16 22:51

文章预览

自:量子位 扫码领取享50优惠!随时可用,先到先得! 前段时间,阿里巴巴数学竞赛中姜萍的事件闹得沸沸扬扬,很多人也让AI尝试挑战这些竞赛题,虽然表现还是不够看,但也能看出来,AI 对于数据库里已有的题目,还是发挥不错的。 不过,近日有人发现,各大 AI 大模型居然在小学生都会的简单数学常识中接连翻车。 这个问题就是,9.11 和 9.9 谁大? 对于人们心目中的天花板 GPT-4 和 GPT-4o,回答丝毫不拖泥带水: 9.11居然比9.9大!我们再看看 Gemini Advanced 的回答: 好的,又是斩钉截铁的给出了一个错误答案。再看到,Claude 3.5 Sonnet 并不像前两位那样直接给出了错误答案,而是开始分析: 分析了一通,拆开还是对的,怎么到了答案,又拉垮了... 经过测试,各大国产大模型也没有幸免于难。 Kimi: ChatGLM: 通义: 元宝: 豆包: 不过令人意外的是,免 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览