文章预览
尽管检索增强生成(RAG)技术赋予了大模型使用外部知识的能力,但其生成结果的准确性和可靠性依然面临重大挑战,尤其在医疗、金融等高度专业化的领域的,实际应用中常因“幻觉”问题而难以落地。为此,我组联合北京师范大学、中国科学院大学、东北大学等机构的研究人员推出了全新的评测方法 RAGEval ,通过 快速构建场景化评估数据实现对检索增强生成(RAG)系统的 “精准诊断” 。 相比以往RAG评测工作,RAGEval不仅具备适应多领域的数据快速构建能力,还提出了全新的评测指标,提供了高效、细致的评测流程。无论是在学术研究还是行业应用中,RAGEval 都为生成式AI带来了更加可信的验证方法,为每一场景中的生成质量保驾护航。 论文信息 ➤ RAGEval论文链接 🔗 https://arxiv.org/abs/2408.01262 ➤ RAGEval数据与代码链接 🔗 https://g
………………………………