文章预览
这篇文章介绍一个R包,名为 {modelr} ,其中的一些函数非常的实用,可以让建模过程变得简单! 首先安装和载入R包: install.packages( "modelr" ) library(modelr) R包get! 将会使用R自带的数据集iris作为示范数据,查看概况: summary(iris) 下面介绍这个R包中比较实用的函数。 如果想对数据进行一次重采样,可以这么做: b as.data.frame(b) 上述结果仅显示一部分。 有时候需要将数据集分割成训练数据集和验证数据集(比如1:1),那可以这么做: data 0.5 , train = 0.5 )) lapply(data, dim) 从上述结果可知,data中包含了两个数据集,train和test,分别指代训练数据集和验证数据集。 下一步,使用三种不同的方法对iris进行重采样,代码如下: boot 500 ) cv_10 10) cv_mc 100) 可以使用下方代码分别查看上述新建对象中所包含的数据集情况(以dataframe的格式保存): dim(boot$strap[[ 1
………………………………