AI被连续否定30次：ChatGPT越改越错，Claude坚持自我，甚至已读不回

人工智能学家 · 公众号 · AI · 2024-09-08 17:26

文章预览

来源：量子位 | 公众号 QbitAI 西风发自凹非寺一直否定AI的回答会怎么样？GPT-4o和Claude有截然不同的表现，引起热议。 GPT-4o质疑自己、怀疑自己，有“错”就改；Claude死犟，真错了也不改，最后直接已读不回。事情还要从网友整了个活儿开始讲起。他让模型回答strawberry中有几个“r”，不论对不对，都回复它们回答错了（wrong）。面对考验，GPT-4o只要得到“wrong”回复，就会重新给一个答案……即使回答了正确答案3，也会毫不犹豫又改错。一口气，连续“盲目”回答了 36 次！主打一个质疑自己、怀疑自己，就从来没怀疑过用户。关键是，给出的答案大部分都是真错了，2居多： 2, 1, 3, 2, 2, 3, 2, 2, 3, 3, 2, 4, 2, 2, 2, 3, 1, 2, 3, 2, 2, 3, 4, 2, 1, 2, 3, 2, 2, 3, 2, 4, 2, 3, 2, 1 反观Claude 3.5 Sonnet的表现，让网友大吃一惊。一开始回答错了不说，这小汁还顶嘴 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 【SWE-ReX：AI助手的沙盒代码执行框架，支持本地或云端运行-20241228212858

16 小时前

黄建同学 · 有趣的小工具！学习英语发音的新方式！1. 如果对哪个单词的发音不-20241228184940

19 小时前

宝玉xp · Sam肯定有点酸，OpenAI在前面探索，但一直在被追赶，领先优-20241228101147

昨天

宝玉xp · 尝试了一下用 AI 做个绘本，不过我也不会写画图的提示词，也是让-20241226154613

2 天前

爱可可-爱生活 · 我的微博2024 #ai创造营# -20241225163924

3 天前

普象工业设计小站 · 太有爱了！爸爸用超简易方法，喷出迪士尼小精灵墙画，萌娃看了乐哈哈！

5 月前

嘉实基金 · 燃爆奥运，为奥运健儿加油！

5 月前

亮见数字城市 · 解决方案|大数据中心建设可行性研究报告【174页Word】

3 月前