文章预览
大型语言模型(LLMs)在生成文本时容易出现“幻觉”,即生成不真实或不忠实的内容,这限制了其在实际场景中的应用。现有的研究主要基于不确定性进行幻觉检测,利用 LLMs 的输出概率计算不确定性,无需依赖外部知识或频繁采样。然而,这些方法通常只关注单个 Token 的不确定性,忽略了 Token 和句子之间复杂的语义关系,导致在多 Token 和跨句子的幻觉检测中存在不足。 在 AAAI2025 上,小红书搜索广告算法团队提出了一种基于语义图增强不确定性建模的幻觉检测方法。首先构建语义图,捕捉实体和句子之间的关系;然后通过实体间的关系进行不确定性传播,提升句子级别的幻觉检测;最后,基于句子与其邻居句子在语义图中的矛盾概率,提出一种图不确定性校准方法,用于不确定性计算。在 WikiBio 和 NoteSum 两个数据集上的实验表明,该方法在段
………………………………