今天看啥  ›  专栏  ›  超超跃跃

stata-数据缺失处理

超超跃跃  · 简书  ·  · 2021-03-22 23:10

文章预览

1.缺漏值一般显示情况

文字类的缺失值“”、N/A、None、Null

数值类的缺失值.、9999(等奇异数值)

数值型的以.居多,值得注意的是以下几点:

*- sum, regress, generate 等,会自动忽略缺失值;

*- count, keep 等,则会将 "." 视为一个无穷大的数值

2.标记缺失值

mvdecode x1 x2, mv(-97 -999)批量 将x1和x2中-97到-999之间的数值更换成.

replace x1 ="." if x1== "N/A"

3.查看缺失值

(1)sum看样本观察值和统计的结果是否一致

(2)misstable sum var,会自动列举出缺失变量的统计情况

(3)利用rmiss()函数

egen miss = rmiss(var)

list var miss if miss!=0 //var存在缺失值miss将会不为0

sum var if miss==0 //列出排除缺失值的统计分析

(4)等价于sum var if missing(var)

(5)利用e(sample)函数

先reg y x control

然后fsum var if e(sample)==1 ,stat(N mean sd min max) format(%6.3f)  cat() label

4.补充缺失值

help mi

help  carryforward

help  carryforward
………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览