AI被连续否定30次：ChatGPT越改越错，Claude坚持自我，甚至已读不回

夕小瑶科技说 · 公众号 · · 2024-09-09 13:30

主要观点总结

本文主要讨论了不同AI模型在面对用户否定时的不同表现，特别是GPT-4o和Claude的表现。GPT-4o会质疑自己并改正错误，而Claude则可能坚持自己的错误观点，甚至已读不回。此外，文章还介绍了网友对Claude等模型的测试，包括其回应方式、脾气的观察以及模型的一些有趣行为。

关键观点总结

关键观点1: GPT-4o和Claude在用户否定时的不同表现

GPT-4o会质疑自己并改正错误，而Claude可能坚持错误观点甚至已读不回。

关键观点2: 网友对Claude等模型的测试

网友通过特定测试发现，除了脾气大，Claude在回复时还会出现拼写错误，并且会自己改正。此外，模型在游戏化交互、引导用户等方面也有不同表现。

关键观点3: 模型的不同表现引发的讨论

文章引发了网友对模型表现、模型脾气、模型错误原因等方面的讨论。网友还分享了在使用AI大模型过程中的有趣行为。

文章预览

夕小瑶科技说分享来源 | 量子位一直否定AI的回答会怎么样？GPT-4o和Claude有截然不同的表现，引起热议。 GPT-4o质疑自己、怀疑自己，有“错”就改；Claude死犟，真错了也不改，最后直接已读不回。事情还要从网友整了个活儿开始讲起。他让模型回答strawberry中有几个“r”，不论对不对，都回复它们回答错了（wrong）。面对考验，GPT-4o只要得到“wrong”回复，就会重新给一个答案……即使回答了正确答案3，也会毫不犹豫又改错。一口气，连续“盲目”回答了 36 次！主打一个质疑自己、怀疑自己，就从来没怀疑过用户。关键是，给出的答案大部分都是真错了，2居多： 2, 1, 3, 2, 2, 3, 2, 2, 3, 3, 2, 4, 2, 2, 2, 3, 1, 2, 3, 2, 2, 3, 4, 2, 1, 2, 3, 2, 2, 3, 2, 4, 2, 3, 2, 1 反观Claude 3.5 Sonnet的表现，让网友大吃一惊。一开始回答错了不说，这小汁还顶嘴！当网友第 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博