专栏名称: 人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
今天看啥  ›  专栏  ›  人工智能学家

「13.11>13.8」冲上热搜,一道题让人类AI集体降智?所有LLM致命缺点曝光

人工智能学家  · 公众号  · AI  · 2024-07-17 19:25
    

文章预览

来源:机器学习研究组订阅 13.8和13.11哪个大? 这个问题,居然难倒了一票人类。 前两天,某知名综艺再次喜提热搜。 只不过,这次是因为有一堆网友提出质疑,认为13.11%应该比13.8%大。 是只有人类这么蠢吗? AI2的研究员林禹臣发现这个现象后,用大模型试了一把,结果出人意料—— AI居然也不行? GPT-4o斩钉截铁地表示:13.11比13.8大。理由如下: 虽然13.8看起来更大,因为它小数点后的数字更少,但13.11实际上更大。这是因为13.8相当于13.80,而13.80小于13.11。 对此,林禹臣po文表示,AI模型在处理复杂问题方面变得越来越强大(比如越来越会做数学奥赛题),但一些常识性问题对于它们来说仍然非常困难。 正如Yejin Choi此前所提出的,AI聪明得令人难以置信,但同时也会蠢得令人震惊。 AI之所以在这个算术题上犯蠢,是因为上下文不清楚的原因吗? ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览