医学博士,R语言及Python爱好者,科研方向为真实世界研究,生信分析与人工智能研究。
今天看啥  ›  专栏  ›  灵活胖子的科研进步之路

利用mice包插补缺失值及效应值估计

灵活胖子的科研进步之路  · 公众号  ·  · 2024-09-10 18:46

文章预览

教程首页 教程地址:https://www.r-bloggers.com/2015/10/imputing-missing-data-with-r-mice-package/ 入门 在分析数据集时,处理缺失数据有以下方案: 删除数据。如果缺失数据占数据集的比例非常小,直接删除具有缺失值的数据就可以了。 替换为简单的值。比如应用均值替换不会改变均值(这是可取的),但会降低方差,这可能是不可取的。另外还可使用中位数、随机数进行替换。 使用该样本的其他数据来猜测此缺失值,即缺失值插补。R 中的 mice 包可帮助您使用合理的数据值来插补缺失值。这些合理的值来自专门为每个缺失数据点设计的分布。 缺失数据主要有两种类型: MCAR:完全随机缺失。这是缺失数据时的理想情况。 MNAR:非随机缺失。非随机数据缺失是一个更严重的问题,在这种情况下,进一步检查数据收集过程并尝试了解信息缺失的原因可能是明智的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览