今天看啥  ›  专栏  ›  硅星人Pro

GPT-4欺骗人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强欺骗值越高

硅星人Pro  · 公众号  · 科技媒体  · 2024-06-11 07:43
    

文章预览

此前,MIT研究发现,AI在各类游戏中为了达到目的,不择手段,学会用佯装、歪曲偏好等方式欺骗人类。 无独有偶,最新一项研究发现,GPT-4在99.16%情况下会欺骗人类! 来自德国的科学家Thilo Hagendorff对LLM展开一系列实验,揭示了大模型存在的潜在风险,最新研究已发表在PNAS。 而且,即便是用了CoT之后,GPT-4还是会在71.46%情况中采取欺骗策略。 论文地址: https://www.pnas.org/doi/full/10.1073/pnas.2317967121 随着大模型和智能体的快速迭代,AI安全研究纷纷警告,未来的「流氓」人工智能可能会优化有缺陷的目标。 因此,对LLM及其目标的控制非常重要,以防这一AI系统逃脱人类监管。 AI教父Hinton的担心,也不是没有道理。 他曾多次拉响警报,「如果不采取行动,人类可能会对更高级的智能AI失去控制」。 当被问及,人工智能怎么能杀死人类呢? Hinton表示,「 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览