注册
登录
专栏名称:
夕小瑶科技说
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
下厨房
·
这菜太上头了,一煮鲜香还暖胃!冬天吃它最幸福 ...
·
2 天前
润农畜牧报价
·
2024年11月22日 ...
·
2 天前
下厨房
·
铁含量是牛肉18.6倍,软滑鲜嫩还最补气血! ...
·
3 天前
企鹅吃喝指南
·
喝到我的梦中情酒了......
·
4 天前
红餐网
·
《重庆火锅发展报告2024》发布:全国门店数 ...
·
5 天前
今天看啥
›
专栏
›
夕小瑶科技说
大模型集体失智!9.11和9.9哪个大,几乎全翻车了
夕小瑶科技说
·
公众号
· · 2024-07-16 15:26
文章预览
夕小瑶科技说 分享 来源 | 量子位 没眼看…… “9.11和9.9哪个大” 这样简单的问题,居然把主流大模型都难倒了?? 强如 GPT-4o ,都坚定地认为9.11更大。 谷歌Gemini Advanced付费版 ,同样的口径。 新王 Claude 3.5 Sonnet ,还一本正经的给出离谱的计算方法。 9.11 = 9 + 1/10 + 1/100 9.9 = 9 + 9/10 到这一步还是对的,但下一步突然就不讲道理了 如上所示,9.11比9.90大0.01。 你想让我进一步详细解释小数的比较吗? 这你还解释啥啊解释,简直要怀疑是全世界AI联合起来欺骗人类了。 艾伦AI研究所成员林禹臣换了个数字测试,GPT-4o依旧翻车,他表示: 一方面AI越来越擅长做数学奥赛题,但另一方面 常识依旧很难 。 也有网友发现了华点, 如果是说软件版本号,那么9.11版本确实比9.9版本更大 (更新)。而AI都是软件工程师开发的,所以…… 那么,究竟是怎么回事? 先 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
下厨房
·
这菜太上头了,一煮鲜香还暖胃!冬天吃它最幸福,出锅香翻三条巷!
2 天前
润农畜牧报价
·
2024年11月22日 持续阴跌,行情弱势,贸易主体陆续出货!
2 天前
下厨房
·
铁含量是牛肉18.6倍,软滑鲜嫩还最补气血!简单一焖鲜到飞起!
3 天前
企鹅吃喝指南
·
喝到我的梦中情酒了......
4 天前
红餐网
·
《重庆火锅发展报告2024》发布:全国门店数超7万家,社区店型走俏
5 天前
PoIiticaI理论志
·
ChatGPT的政治偏见:一项模拟实验研究 | Public Choice
4 月前
张佳玮写字的地方
·
塔图姆换投篮姿势了:逐渐库里化?
1 月前