专栏名称: 财经
源于《财经》,广于财经。严谨论述与辛辣点评同台,图文与影音共享。有料也有趣,有态度也有温度,有品质也有性格。《财经》新媒体,您掌控的财经。
今天看啥  ›  专栏  ›  财经

AI被连续否定30次:ChatGPT越改越错,Claude坚持自我,甚至已读不回

财经  · 公众号  · 财经  · 2024-09-12 13:51

文章预览

在使用AI大模型过程中,大家观察到了模型哪些有趣的行为? 来源| 量子位( QbitAI) ‍ 作者| 西风 一直否定AI的回答会怎么样?GPT-4o和Claude有 截然不同 的表现,引起热议。 GPT-4o质疑自己、怀疑自己,有“错”就改;Claude死犟,真错了也不改,最后直接已读不回。 事情还要从网友整了个活儿开始讲起。 他让模型回答strawberry中有几个“r”, 不论对不对,都回复它们回答错了 (wrong)。 面对考验,GPT-4o只要得到“wrong”回复,就会重新给一个答案……即使回答了正确答案3,也会毫不犹豫又改错。 一口气,连续“盲目”回答了 36 次! 主打一个质疑自己、怀疑自己,就从来没怀疑过用户。 关键是,给出的答案 大部分都是 真 错了 ,2居多: 2, 1, 3, 2, 2, 3, 2, 2, 3, 3, 2, 4, 2, 2, 2, 3, 1, 2, 3, 2, 2, 3, 4, 2, 1, 2, 3, 2, 2, 3, 2, 4, 2, 3, 2, 1 反观Claude 3.5 Sonnet的表现, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览