GPT-4欺骗人类高达99.16%惊人率！PNAS重磅研究曝出，LLM推理越强欺骗值越高

硅星人Pro · 公众号 · 科技媒体 · 2024-06-11 07:43

文章预览

此前，MIT研究发现，AI在各类游戏中为了达到目的，不择手段，学会用佯装、歪曲偏好等方式欺骗人类。无独有偶，最新一项研究发现，GPT-4在99.16%情况下会欺骗人类！来自德国的科学家Thilo Hagendorff对LLM展开一系列实验，揭示了大模型存在的潜在风险，最新研究已发表在PNAS。而且，即便是用了CoT之后，GPT-4还是会在71.46%情况中采取欺骗策略。论文地址： https://www.pnas.org/doi/full/10.1073/pnas.2317967121 随着大模型和智能体的快速迭代，AI安全研究纷纷警告，未来的「流氓」人工智能可能会优化有缺陷的目标。因此，对LLM及其目标的控制非常重要，以防这一AI系统逃脱人类监管。 AI教父Hinton的担心，也不是没有道理。他曾多次拉响警报，「如果不采取行动，人类可能会对更高级的智能AI失去控制」。当被问及，人工智能怎么能杀死人类呢？ Hinton表示，「 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

36氪 · 技术狂飙、应用井喷，企业如何在AI创新中找出口？

18 小时前

南方都市报 · 细思恐极！记者花300元，买到了同事的秘密……

2 天前

南方都市报 · 细思恐极！记者花300元，买到了同事的秘密……

2 天前

新浪科技 · 【#美科学家发现新型有机金属分子锫茂#，成果登上《科学》】有机金-20250319081500

2 天前

36氪 · 专注微创手术器械产品开发，「普瑞顺祥」获数千万元A轮融资｜早起看早期

2 天前

新浪科技 · #福耀玻璃拟派发每股1.8元现金股利#【#福耀玻璃2024年净利-20250318194800

2 天前

刀法研究所 · lululemon的魔咒要被Alo Yoga打破了吗？

7 月前

21财闻汇 · 一次“上新”50宗地块，广州能否激起拿地热情？

7 月前

郑州本地宝 · 不用来回跑！线上一键“还清房贷”→

4 月前

神兽集团 · 扎克伯格称苹果赚钱全靠压榨

2 月前

神兽集团 · 扎克伯格称苹果赚钱全靠压榨

2 月前