文章预览
下面给大家演示如何用 tidymodels 实现bootstrap任意指标,这样你就可以获得任意指标的bootstrap置信区间,对于一些图形,比如ROC曲线,还可以顺便获得bootstrap-ROC曲线。 这个方法是通用的方法,主要有以下优点: 适用于一切模型(tidymodels支持的模型),不只是线性回归、逻辑回归; 适用于一切指标(tidymodels支持的模型); 与内部重抽样的方法无关,即使不是bootstrap法,也能计算bootstrap法的置信区间 下面就以随机森林模型为例,实现各种指标的bootstrap! 加载数据和R包 演示数据为印第安人糖尿病数据集,这个数据一共有768行,9列,其中 diabetes 是结果变量,为二分类,其余列是预测变量。 rm(list = ls()) load(file = "../000files/pimadiabetes.rdata" ) dim(pimadiabetes) [1] 768 9 str(pimadiabetes) 'data.frame': 768 obs. of 9 variables: $ pregnant: num 6 1 8 1 0 5 3 10 2 8 ... $ glucose : n
………………………………