今天看啥  ›  专栏  ›  R语言和统计

{modelr}: 让建模变得简单!

R语言和统计  · 公众号  · 科技自媒体  · 2024-06-07 12:51
    

主要观点总结

这篇文章介绍了一个名为modelr的R包,该包提供了一系列实用的函数,可以简化建模过程。文章演示了如何使用这个R包进行数据处理、重采样、建立模型以及查看模型表现。

关键观点总结

关键观点1: 安装和载入R包modelr

文章首先介绍了如何安装和载入modelr包,为后续的操作做准备。

关键观点2: 使用modelr包处理数据

文章演示了如何使用modelr包进行重采样、分割数据集等数据处理操作。

关键观点3: 使用modelr包建立模型

文章介绍了如何使用modelr包建立模型,并使用示例数据iris进行演示。

关键观点4: 查看模型表现

文章展示了如何使用modelr包中的函数查看模型的表现,包括计算RMSE、R2、MAE和QAE等指标。

关键观点5: 添加预测值和残差

文章最后介绍了如何使用modelr包中的函数计算模型的预测值和残差,并将结果添加到数据集中,以便后续分析。


文章预览

这篇文章介绍一个R包,名为 {modelr} ,其中的一些函数非常的实用,可以让建模过程变得简单! 首先安装和载入R包:  install.packages( "modelr" ) library(modelr) R包get! 将会使用R自带的数据集iris作为示范数据,查看概况:  summary(iris) 下面介绍这个R包中比较实用的函数。 如果想对数据进行一次重采样,可以这么做:  b as.data.frame(b) 上述结果仅显示一部分。 有时候需要将数据集分割成训练数据集和验证数据集(比如1:1),那可以这么做:  data 0.5 , train = 0.5 )) lapply(data, dim) 从上述结果可知,data中包含了两个数据集,train和test,分别指代训练数据集和验证数据集。 下一步,使用三种不同的方法对iris进行重采样,代码如下:  boot 500 ) cv_10 10) cv_mc 100) 可以使用下方代码分别查看上述新建对象中所包含的数据集情况(以dataframe的格式保存):  dim(boot$strap[[ 1 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览