主要观点总结
本文介绍了马里兰大学的研究团队提出的名为AutoHallusion的视觉大模型幻觉自动生成框架。该框架能够自动生成大量的大模型幻觉案例,有效缓解当前大模型幻觉研究中数据集缺乏的问题。该框架基于认知科学原理,针对大模型产生幻觉的原因,提出了三种主要策略。文章概述了大模型的幻觉现象以及AUTOHALLUSION框架的工作流程和实验结果,并介绍了该基准数据集的评估指标。
关键观点总结
关键观点1: 研究背景
随着对大模型的深入研究,研究人员发现大模型在认知和推理任务上,其思维过程与人脑有一定相似之处。针对人脑认知失调特点设计的实验也能使大模型出现类似的“幻觉”现象。
关键观点2: AUTOHALLUSION框架介绍
AUTOHALLUSION是一个视觉大模型幻觉自动生成框架,基于认知科学原理,针对大模型产生幻觉的原因,提出了三种主要策略:插入异常物体、插入成对物体和移除相关物体。该框架能够自动生成各种幻觉案例并进行批量生产,用于评估大模型的性能。
关键观点3: 实验方法和结果
研究团队在包括GPT-4V、Gemini、Claude和LLaVA等最新大模型上进行了实验,并整理发布了一个基准数据集来评估模型性能。实验结果表明,GPT-4V等大模型的问答准确率最高仅为66.0%。此外,该研究还展示了一些实验结果和基准数据集评估指标。
文章预览
来源 :机器之心 本文 约2600字 ,建议阅读 10分钟 本文从多样性、图像质量、有效性三个方面评估了通过 AutoHallusion 生成的基准数据集。 本文的共同第一作者是马里兰大学电子计算机工程系的博士生吴曦旸 (https://wuxiyang1996.github.io/) 和计算机科学系的关天瑞 (https://tianruiguan.phd/) 。吴曦旸的研究方向主要涵盖强化学习、自动驾驶,以及大语言模型在机器人导航和计算机视觉中的应用。关天瑞的研究则聚焦于计算机视觉和视觉语言模型在机器人、自动驾驶等领域的应用。本文的指导老师为李典奇,周天翼教授 (https://tianyizhou.github.io/) 和 Dinesh Manocha 教授 (https://www.cs.umd.edu/people/dmanocha) 。 想象一下,有一天你在沙漠中看到一个雪人,或者在雪地里发现一棵棕榈树。面对这些与周围环境格格不入的景象,你是否会感到心理上的不适? 在认知科学
………………………………