专栏名称: TsinghuaNLP
清华大学自然语言处理与社会人文计算实验室,是中国中文信息学会计算语言专业委员会和中国人工智能学会不确定性专业委员会的挂靠单位。负责人为清华大学计算机科学与技术系孙茂松教授,核心骨干为刘洋副教授,刘知远助理教授。
今天看啥  ›  专栏  ›  TsinghuaNLP

成果|RAGEval:实现实际场景检索增强生成系统(RAG)的“精准诊断”

TsinghuaNLP  · 公众号  ·  · 2024-11-08 18:00
    

文章预览

尽管检索增强生成(RAG)技术赋予了大模型使用外部知识的能力,但其生成结果的准确性和可靠性依然面临重大挑战,尤其在医疗、金融等高度专业化的领域的,实际应用中常因“幻觉”问题而难以落地。为此,我组联合北京师范大学、中国科学院大学、东北大学等机构的研究人员推出了全新的评测方法  RAGEval ,通过 快速构建场景化评估数据实现对检索增强生成(RAG)系统的 “精准诊断” 。 相比以往RAG评测工作,RAGEval不仅具备适应多领域的数据快速构建能力,还提出了全新的评测指标,提供了高效、细致的评测流程。无论是在学术研究还是行业应用中,RAGEval 都为生成式AI带来了更加可信的验证方法,为每一场景中的生成质量保驾护航。 论文信息  ➤   RAGEval论文链接   🔗 https://arxiv.org/abs/2408.01262  ➤   RAGEval数据与代码链接   🔗 https://g ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览