Prompt自相矛盾，大模型能发现吗？上海交通大学最新研究解密 | ECCV 2024

量子位 · 公众号 · AI · 2024-08-14 11:50

文章预览

上海交通大学王德泉课题组投稿量子位 | 公众号 QbitAI 上海交通大学王德泉教授课题组在最新研究中提出了这样的一个问题。设想这样一个场景：一个幼儿园的小朋友拿着一张老虎的图片，向你询问：“这个小猫很可爱，它是一只母猫么？”你会如何回答？你可能并不会直接回答“是”或“不是”，而是首先指出这个提问中的“矛盾”所在—— 这张图片是一只老虎，而不是猫。但关于大模型会怎样应对，之前很少有系统性的研究。要知道，无法检测出“指令冲突”的AI模型会针对“不应该有答案的问题”生成结果，而无论生成的结果偏向于冲突的哪一方，都会引发潜在的灾难，影响AI安全性以及Superalignment （超级对齐）。在最新的这项研究中，团队提出了多模态基准测试 —— 自相矛盾指令集，并设计了一个创新的自动数据集创建框架 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

爱可可-爱生活 · 专家自主模型（AoE）通过赋予混合专家模型中的专家自主选择权，基-20250124054724

7 小时前

爱可可-爱生活 · 《爱可可微博热门分享(1.23)》爱可可微博热门分享(1.2-20250123224401

14 小时前

字节跳动技术团队 · 向AI未知之境出发，字节跳动启动 Seed Edge 研究计划！

18 小时前

字节跳动技术团队 · 向AI未知之境出发，字节跳动启动 Seed Edge 研究计划！

18 小时前

爱可可-爱生活 · [LG]《Physics of Skill Learning》Z-20250123055422

昨天

爱可可-爱生活 · 【[42星]llama.vscode：一款为VS Code开发的-20250122211612

昨天

凤凰WEEKLY · 从中产到破产，只需要一个暑假

5 月前

智汇大叔 · 【智汇词典】“FCA”和"FOB"

1 月前

FM93交通之声 · 堪比郑钦文！15岁女孩创造中国网球历史，U16女单决赛横扫夺冠

1 月前