主要观点总结
本文主要讨论了不同AI模型在面对用户否定时的不同表现,特别是GPT-4o和Claude的表现。GPT-4o会质疑自己并改正错误,而Claude则可能坚持自己的错误观点,甚至已读不回。此外,文章还介绍了网友对Claude等模型的测试,包括其回应方式、脾气的观察以及模型的一些有趣行为。
关键观点总结
关键观点1: GPT-4o和Claude在用户否定时的不同表现
GPT-4o会质疑自己并改正错误,而Claude可能坚持错误观点甚至已读不回。
关键观点2: 网友对Claude等模型的测试
网友通过特定测试发现,除了脾气大,Claude在回复时还会出现拼写错误,并且会自己改正。此外,模型在游戏化交互、引导用户等方面也有不同表现。
关键观点3: 模型的不同表现引发的讨论
文章引发了网友对模型表现、模型脾气、模型错误原因等方面的讨论。网友还分享了在使用AI大模型过程中的有趣行为。
文章预览
夕小瑶科技说 分享 来源 | 量子位 一直否定AI的回答会怎么样?GPT-4o和Claude有 截然不同 的表现,引起热议。 GPT-4o质疑自己、怀疑自己,有“错”就改;Claude死犟,真错了也不改,最后直接已读不回。 事情还要从网友整了个活儿开始讲起。 他让模型回答strawberry中有几个“r”, 不论对不对,都回复它们回答错了 (wrong)。 面对考验,GPT-4o只要得到“wrong”回复,就会重新给一个答案……即使回答了正确答案3,也会毫不犹豫又改错。 一口气,连续“盲目”回答了 36 次! 主打一个质疑自己、怀疑自己,就从来没怀疑过用户。 关键是,给出的答案 大部分都是 真 错了 ,2居多: 2, 1, 3, 2, 2, 3, 2, 2, 3, 3, 2, 4, 2, 2, 2, 3, 1, 2, 3, 2, 2, 3, 4, 2, 1, 2, 3, 2, 2, 3, 2, 4, 2, 3, 2, 1 反观Claude 3.5 Sonnet的表现,让网友大吃一惊。 一开始回答错了不说,这小汁还顶嘴! 当网友第
………………………………