今天看啥  ›  专栏  ›  熊猫Jay字节之旅

13.8和13.11比大小:一众大模型“皆醉”,唯文心一言“独醒”

熊猫Jay字节之旅  · 公众号  ·  · 2024-07-17 18:30

文章预览

近期,在第十期《歌手》节目播出后,关于得票率排名的争议全网可是吵翻天了。 孙楠和外国歌手香缇莫的得票率分别为 13.8%和 13.11%,有观众认为 13.11%比 13.8%大,觉得节目组最后公布的榜单有误,应该是香缇莫的排名高于孙楠。 这一简单的比大小题目在迷惑了不少观众的同时也难到了不少 AI,多家 AI 应用在处理这两个数字对比的指令时出现了误判,认为 13.11%大于 13.8%,唯独文心一言 APP 给出了正确答案。 AI 的小失误,技术问题的大启示: 面对 13.8 与 13.11 这两个简单的数字对比,行业内较为知名的的通义千问、ChatGPT、Kimi 也不慎失手,未能准确判断其大小关系。 通义一本正经地分析了一通、ChatGPT 和 Kimi“干净利落”一句话,最后都得出 13.11 比 13.8 的结论。 出现这令人啼笑皆非的一幕,人们纷纷开始感叹 AI 技术的不靠谱,但细细想来,这何尝 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览