主要观点总结
本文介绍了如何使用R语言中的ggmice包解决数据分析透明性问题,特别是多重填补后的数据可视化。文章首先载入相关R包,并使用ggmice函数对数据进行多重填补。然后介绍如何使用ggmice函数结合ggplot2制作图表,包括散点图和分组作图。最后,文章展示如何对多重填补后的数据进行可视化,并提供了相关代码示例。
关键观点总结
关键观点1: 解决数据分析透明性问题的方法之一是使用多重填补并进行数据可视化。
文章中介绍了使用R语言中的ggmice包进行多重填补和数据可视化的过程。
关键观点2: 使用ggmice函数进行数据可视化,可以方便地标记出缺失值。
文章中提供了使用ggmice函数制作散点图和分组作图的示例代码。
关键观点3: 多重填补后的数据可视化可以帮助更好地理解数据的填补情况。
文章中介绍了如何使用ggmice函数对多重填补后的数据进行可视化,并提供了相关代码示例。
关键观点4: 结合ggplot2的延伸能力,可以制作出更复杂的图表来展示数据。
文章中展示了如何结合ggplot2的延伸能力,添加箱形图等复杂图表来展示数据。
文章预览
如果被人质疑数据分析的透明性问题, 比如审稿人让你画出多重填补后的图,那该怎么做? 小编今天献上一策! 首先安装并且载入相关R包: install.packages( "ggmice" ) library(mice) library(ggplot2) library(ggmice) R包get! 将使用R包 {mice} 中的数据集,名为boys,查看下概况: mydata summary(mydata) 从上面的结果可知,大部分变量存在缺失值。 下一步,对上述数据集进行多重填补,使用默认的Predictive mean matching(pmm)法,代码如下: imputed 5 , method = "pmm" ) 填补完毕,数据将会保存在对象imputed中,将会用于填补后的作图。 首先使用原始数据mydata介绍 ggmice() 函数,比如制作一个散点图,将会把缺失值用红色标出,非常实用: ggmice(mydata, aes(x = age, y = hgt)) + geom_point() hgt包含几个缺失值,默认会在另外一个坐标轴(即x轴)上标记出,颜色为红色。 再举一个例子,假
………………………………