主要观点总结
这篇文章介绍了一个名为modelr的R包,该包提供了一系列实用的函数,可以简化建模过程。文章演示了如何使用这个R包进行数据处理、重采样、建立模型以及查看模型表现。
关键观点总结
关键观点1: 安装和载入R包modelr
文章首先介绍了如何安装和载入modelr包,为后续的操作做准备。
关键观点2: 使用modelr包处理数据
文章演示了如何使用modelr包进行重采样、分割数据集等数据处理操作。
关键观点3: 使用modelr包建立模型
文章介绍了如何使用modelr包建立模型,并使用示例数据iris进行演示。
关键观点4: 查看模型表现
文章展示了如何使用modelr包中的函数查看模型的表现,包括计算RMSE、R2、MAE和QAE等指标。
关键观点5: 添加预测值和残差
文章最后介绍了如何使用modelr包中的函数计算模型的预测值和残差,并将结果添加到数据集中,以便后续分析。
文章预览
这篇文章介绍一个R包,名为 {modelr} ,其中的一些函数非常的实用,可以让建模过程变得简单! 首先安装和载入R包: install.packages( "modelr" ) library(modelr) R包get! 将会使用R自带的数据集iris作为示范数据,查看概况: summary(iris) 下面介绍这个R包中比较实用的函数。 如果想对数据进行一次重采样,可以这么做: b as.data.frame(b) 上述结果仅显示一部分。 有时候需要将数据集分割成训练数据集和验证数据集(比如1:1),那可以这么做: data 0.5 , train = 0.5 )) lapply(data, dim) 从上述结果可知,data中包含了两个数据集,train和test,分别指代训练数据集和验证数据集。 下一步,使用三种不同的方法对iris进行重采样,代码如下: boot 500 ) cv_10 10) cv_mc 100) 可以使用下方代码分别查看上述新建对象中所包含的数据集情况(以dataframe的格式保存): dim(boot$strap[[ 1
………………………………