专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
今天看啥  ›  专栏  ›  爱可可-爱生活

【judges:一个轻量级的LLM评估库,提供多种预设的AI评判-20241130172425

爱可可-爱生活  · 微博  · AI  · 2024-11-30 17:24
    

文章预览

2024-11-30 17:24 本条微博链接 【judges:一个轻量级的LLM评估库,提供多种预设的AI评判模型。支持分类器(Classifier)和评分器(Grader)两大类评判方式,可用于评估AI回答的事实准确性、幻觉检测、有害内容识别、查询质量等多个维度。特色是可以组合多个评判模型形成陪审团(Jury),实现更全面的评估】 'A small library of LLM judges' GitHub: github.com/quotient-ai/judges #AI评估# #LLM工具# #内容审核# #AI安全# ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览