今天看啥  ›  专栏  ›  爱可可-爱生活

提出HaloScope框架,通过识别语言模型激活的幻觉子空间估计-20240928045112

爱可可-爱生活  · 微博  · AI  · 2024-09-28 04:51
    

文章预览

2024-09-28 04:51 本条微博链接 提出HaloScope框架,通过识别语言模型激活的幻觉子空间估计无标注生成数据的成员身份,在此基础上训练真实性分类器,实现无需人工标注即可检测语言模型生成的幻觉。 [LG]《HaloScope: Harnessing Unlabeled LLM Generations for Hallucination Detection》X Du, C Xiao, Y Li [University of Wisconsin-Madison] (2024) ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览