文章预览
1 概念原理 针对机器学习中最常见的二分类问题,有一些专用的度量,下面是其中的几个。 1.1 混淆矩阵(Confusion Matrix) TP(True Positive,真正):将正类预测为正类数 TN(True Negative,真负):将负类预测为负类数 FP(False Positive,假正):将负类预测为正类数误报(Type I error) FN(False Negative,假负):将正类预测为负类数-->漏报(Type II error) 1.2 ROC曲线与AUC ROC曲线 ,是在不同分类阈值上对比真正率(TPR,y轴)与假正率(FPR, x轴)的曲线,ROC 曲线下面的面积叫做 AUC 。 2 R语言实现 为了通用性,以下函数都是针对 mlr3 的学习器预测结果对象设计。 预测结果数据框 prediction 要包含两列: truth 为因子型的真实标签,第一水平为正例 prob 为预测为正例的概率 下面先列出各个自定义函数。 2.1 计算及可视化混淆矩阵(也支持多分类) 根据预测结果
………………………………