注册
登录
专栏名称:
中国人工智能学会
关注中国人工智能学会官方公共账号,收取学会的科普信息、新闻动态、活动预告及人工智能领域科技前沿信息。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
本文创新性地提出了一种基于语言 Agent ...
·
昨天
爱可可-爱生活
·
[LG]《AdditiveLLM: ...
·
昨天
宝玉xp
·
推荐阅读:Deepseek ...
·
2 天前
爱可可-爱生活
·
【[19星]DataFusion ...
·
2 天前
爱可可-爱生活
·
【[5星]gla-jax:用JAX和pall ...
·
5 天前
今天看啥
›
专栏
›
中国人工智能学会
热点关注丨大模型集体失智!9.11和9.9哪个大,几乎全翻车了
中国人工智能学会
·
公众号
·
AI
· 2024-07-18 17:01
文章预览
转自 量子位 梦晨 一水 发自 凹非寺 量子位 | 公众号 QbitAI 没眼看…… “9.11和9.9哪个大” 这样简单的问题,居然把主流大模型都难倒了?? 强如 GPT-4o ,都坚定地认为9.11更大。 谷歌Gemini Advanced付费版 ,同样的口径。 新王 Claude 3.5 Sonnet ,还一本正经的给出离谱的计算方法。 9.11 = 9 + 1/10 + 1/100 9.9 = 9 + 9/10 到这一步还是对的,但下一步突然就不讲道理了 如上所示,9.11比9.90大0.01。 你想让我进一步详细解释小数的比较吗? 这你还解释啥啊解释,简直要怀疑是全世界AI联合起来欺骗人类了。 艾伦AI研究所成员林禹臣换了个数字测试,GPT-4o依旧翻车,他表示: 一方面AI越来越擅长做数学奥赛题,但另一方面 常识依旧很难 。 也有网友发现了华点, 如果是说软件版本号,那么9.11版本确实比9.9版本更大 (更新)。 而AI都是软件工程师开发的,所以…… 那 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
爱可可-爱生活
·
本文创新性地提出了一种基于语言 Agent 模拟的技术,揭示了即-20250131054655
昨天
爱可可-爱生活
·
[LG]《AdditiveLLM: Large Language-20250131060249
昨天
宝玉xp
·
推荐阅读:Deepseek R1可能找到了超越人类的办法链接:网-20250130235436
2 天前
爱可可-爱生活
·
【[19星]DataFusion Query Cache:为Ap-20250130212345
2 天前
爱可可-爱生活
·
【[5星]gla-jax:用JAX和pallas实现Gated -20250127181258
5 天前
李鲆
·
富贵险中求,也在险中丢。求时十之一,丢时十之九。富贵这种事,就是-20240703083800
7 月前
酱油哥张夫子
·
又一座城市铁饭碗不保。。。
6 月前
北美留学生观察
·
暑假末班车!美国TOP30+英国G5名校科研,报名即将截止,速速上车
6 月前
云南网
·
官方批复:原则同意!涉及云南2个项目
2 月前
能源新媒
·
订购推荐 |《绿证与碳资产管理》重磅上市!(附第14期目录)
1 月前