Zero-shot知识测试LLM的推理幻觉

AI大模型学习基地 · 公众号 · · 2025-01-03 16:25

文章预览

本文介绍了一种新的方法用于检测大型语言模型（ LLM ）生成的幻觉文本，特别是通过区分三种类型的幻觉：对齐（ aligned ）、错位（ misaligned ）和捏造（ fabricated ）。现有的检测方法未能有效区分不同类型的幻觉，导致检测性能不足。为此，作者提出了一种“幻觉推理”（ hallucination reasoning ）任务，并设计了一种零样本方法，能够在没有外部知识、数据集标签或模型微调的情况下，评估 LLM 是否具备足够的知识来生成文本。通过模型知识测试（ MKT ）和对齐测试（ Alignment Test ），该方法能够准确分类 LLM 生成的文本，提高现有检测方法的表现。实验结果表明，该方法在多项数据集上的表现显著优于传统方法，特别是在识别捏造文本方面。 1 二阶段工作流程模型知识测试（Model Knowledge Test, MKT）： ·该测试的目的是检查智能体是否具备足够的知 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博