大模型的最大bug，回答正确率几乎为零，GPT到Llama无一幸免

量化研究方法 · 公众号 · · 2024-08-03 20:30

文章预览

来源：数学建模andMATLAB ‍ 大模型的逻辑？不存在的。我让 GPT-3 和 Llama 学会一个简单的知识：A 就是 B，然后反过来问 B 是什么，结果发现 AI 回答的正确率竟然是零。这是什么道理？近日，一个叫「逆转诅咒」（Reversal Curse）的新概念成为了 AI 圈热议的话题，现在流行的所有大语言模型全部都中招了。面对简单到不能再简单的问题，它们的准确率不仅是接近为零，而且看不出有增加正确率的可能性。而且，研究人员发现，这个大 bug 与模型体量，问的问题什么的都没有关系。我们说 AI 发展到预训练大模型阶段，终于看起来像是掌握了一点逻辑思维，结果这次却像是被打回了原形。图 1：GPT-4 中的知识不一致现象。GPT-4 正确给出了汤姆・克鲁斯母亲的名字（左）。然而当输入母亲的名字问儿子时，它却无法检索到「汤姆・克鲁斯」（右）。新研 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

YNTV2都市条形码 · 紧急召回，这款食品疑有蟑螂混入！网友：刚买了一堆……

6 小时前

正商阅读 · 日本“失去的三十年”：沉思与启示

3 天前

日本万象 · 日本天价老破小爆火全网，出价9亿还不肯卖？！原因曝光，网友直呼：不卖就对了！

3 天前

中国能源报 · 日本一核电机组反应堆重启运行

5 天前

互联网er的早读课 · AI早知道｜首个完全由AI驱动的游戏引擎发布；OpenAI估值有望超1000亿美元。

2 月前