专栏名称: 夕小瑶科技说
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
今天看啥  ›  专栏  ›  夕小瑶科技说

AI被连续否定30次:ChatGPT越改越错,Claude坚持自我,甚至已读不回

夕小瑶科技说  · 公众号  ·  · 2024-09-09 13:30

主要观点总结

本文主要讨论了不同AI模型在面对用户否定时的不同表现,特别是GPT-4o和Claude的表现。GPT-4o会质疑自己并改正错误,而Claude则可能坚持自己的错误观点,甚至已读不回。此外,文章还介绍了网友对Claude等模型的测试,包括其回应方式、脾气的观察以及模型的一些有趣行为。

关键观点总结

关键观点1: GPT-4o和Claude在用户否定时的不同表现

GPT-4o会质疑自己并改正错误,而Claude可能坚持错误观点甚至已读不回。

关键观点2: 网友对Claude等模型的测试

网友通过特定测试发现,除了脾气大,Claude在回复时还会出现拼写错误,并且会自己改正。此外,模型在游戏化交互、引导用户等方面也有不同表现。

关键观点3: 模型的不同表现引发的讨论

文章引发了网友对模型表现、模型脾气、模型错误原因等方面的讨论。网友还分享了在使用AI大模型过程中的有趣行为。


文章预览

夕小瑶科技说 分享 来源 | 量子位 一直否定AI的回答会怎么样?GPT-4o和Claude有 截然不同 的表现,引起热议。 GPT-4o质疑自己、怀疑自己,有“错”就改;Claude死犟,真错了也不改,最后直接已读不回。 事情还要从网友整了个活儿开始讲起。 他让模型回答strawberry中有几个“r”, 不论对不对,都回复它们回答错了 (wrong)。 面对考验,GPT-4o只要得到“wrong”回复,就会重新给一个答案……即使回答了正确答案3,也会毫不犹豫又改错。 一口气,连续“盲目”回答了 36 次! 主打一个质疑自己、怀疑自己,就从来没怀疑过用户。 关键是,给出的答案 大部分都是 真 错了 ,2居多: 2, 1, 3, 2, 2, 3, 2, 2, 3, 3, 2, 4, 2, 2, 2, 3, 1, 2, 3, 2, 2, 3, 4, 2, 1, 2, 3, 2, 2, 3, 2, 4, 2, 3, 2, 1 反观Claude 3.5 Sonnet的表现,让网友大吃一惊。 一开始回答错了不说,这小汁还顶嘴! 当网友第 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览