文章预览
教程首页 教程地址:https://www.r-bloggers.com/2015/10/imputing-missing-data-with-r-mice-package/ 入门 在分析数据集时,处理缺失数据有以下方案: 删除数据。如果缺失数据占数据集的比例非常小,直接删除具有缺失值的数据就可以了。 替换为简单的值。比如应用均值替换不会改变均值(这是可取的),但会降低方差,这可能是不可取的。另外还可使用中位数、随机数进行替换。 使用该样本的其他数据来猜测此缺失值,即缺失值插补。R 中的 mice 包可帮助您使用合理的数据值来插补缺失值。这些合理的值来自专门为每个缺失数据点设计的分布。 缺失数据主要有两种类型: MCAR:完全随机缺失。这是缺失数据时的理想情况。 MNAR:非随机缺失。非随机数据缺失是一个更严重的问题,在这种情况下,进一步检查数据收集过程并尝试了解信息缺失的原因可能是明智的
………………………………