专栏名称: 量化研究方法
以量化之思想认识世界,体会量化之美。
今天看啥  ›  专栏  ›  量化研究方法

大模型的最大bug,回答正确率几乎为零,GPT到Llama无一幸免

量化研究方法  · 公众号  ·  · 2024-08-03 20:30

文章预览

来源:数学建模andMATLAB ‍ 大模型的逻辑?不存在的。 我让 GPT-3 和 Llama 学会一个简单的知识:A 就是 B,然后反过来问 B 是什么,结果发现 AI 回答的正确率竟然是零。 这是什么道理? 近日,一个叫「逆转诅咒」(Reversal Curse)的新概念成为了 AI 圈热议的话题,现在流行的所有大语言模型全部都中招了。面对简单到不能再简单的问题,它们的准确率不仅是接近为零,而且看不出有增加正确率的可能性。 而且,研究人员发现,这个大 bug 与模型体量,问的问题什么的都没有关系。 我们说 AI 发展到预训练大模型阶段,终于看起来像是掌握了一点逻辑思维,结果这次却像是被打回了原形。 图 1:GPT-4 中的知识不一致现象。GPT-4 正确给出了汤姆・克鲁斯母亲的名字(左)。然而当输入母亲的名字问儿子时,它却无法检索到「汤姆・克鲁斯」(右)。新研 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览