【NeurIPS 2024】HaloScope：利用未标记的大型语言模型生成进行幻觉检测

专知 · 公众号 · · 2024-09-28 12:00

文章预览

大型语言模型（LLMs）应用的激增引发了人们对生成误导性或虚假信息（即幻觉）的担忧。因此，检测幻觉已成为维护 LLM 生成内容可信度的关键。学习真实分类器的一大挑战是缺乏大量标记的真实和幻觉数据。为了解决这一挑战，我们推出了 HaloScope，这是一种新颖的学习框架，利用未标记的 LLM 生成文本进行幻觉检测。这种未标记数据在 LLM 部署到开放世界时自由产生，包含真实和幻觉信息。为了有效利用这些未标记数据，我们提出了一种自动化的成员资格估计评分，用于区分未标记混合数据中的真实与不真实生成，从而实现二元真实分类器的训练。重要的是，我们的框架不需要额外的数据收集和人工标注，为实际应用提供了很大的灵活性和可行性。大量实验表明，HaloScope 在幻觉检测性能上表现优越，显著超过了竞争对手。代码可在 https://github.c ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

有方空间 · 旅行招募︱细部背后：斯卡帕与意大利北部城市·第3期（含米兰家具展，2025年4月8日—12日）

昨天

CDA数据分析师 · 【话题】知乎热帖：一个人为何会陷入社会底层？

2 天前

数据派THU · 仅总参数量0.1%、单GPU 15分钟完成微调，人类基因组基础模型NT登Nature子刊

3 天前

科学家庭育儿 · 到处都在断货！今年夏天最好用的包竟然是它们？

5 月前

我爱学逻辑 · 【面试每日一练315】作为新时代的青年人，结合自己所从事的工作岗位，请从以下三条选择其一谈谈你对此的理解

1 月前