主要观点总结
本文介绍了关于数据处理中缺失值处理的内容,包括数据缺失的定义、原因、影响,以及处理缺失数据的传统方式和多重插补初探等。
关键观点总结
关键观点1: 数据缺失的定义和原因
数据缺失是指那些实际未观测到,但如果观测到会有意义的值。信息未被采集到、信息被采集后丢失或认定有误并被删除都可能导致数据缺失。
关键观点2: 数据缺失的影响
数据缺失会削弱数据能效,分析过程中需要缺失数据满足相应假设,错误的假设可能导致结果偏误。
关键观点3: 处理数据缺失的传统方式
常用的缺失数据处理方法可以总结为直接删除法和单一插补法。直接删除法包括成列删除和成对删除,单一插补法包括算术平均插补法、回归插补法和随机回归插补法等。
关键观点4: 多重插补初探
多重插补法为单一插补法下的标准误低估问题提供了一个解决方案,其通过引入观测数据的可变性、估计插补模型的不确定性和生成插补值的不确定性增加数据的标准误。
文章预览
👇 连享会 · 推文导航 | www.lianxh.cn 🍎 Stata: Stata基础 | Stata绘图 | Stata程序 | Stata新命令 📘 论文: 数据处理 | 结果输出 | 论文写作 | 数据分享 💹 计量: 回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归 ⛳ 专题: SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析 🔃 因果: DID | RDD | 因果推断 | 合成控制法 | PSM-Matching 🔨 工具: 工具软件 | Markdown | Python-R-Stata 🎧 课程: 公开课-直播 | 计量专题 | 关于连享会 连享会课程 · 2024 暑期班 作者 :孟佳音 (University College London) 邮箱 :jiayin.meng.20@ucl.ac.uk 目录 1. 理解数据缺失 2. 数据缺失模式与机制 2.1 数据缺失常见模式 2.2 数据缺失机制 3. 处理数据缺失的传统方式 3.1 直
………………………………