文章预览
1.缺漏值一般显示情况
文字类的缺失值“”、N/A、None、Null
数值类的缺失值.、9999(等奇异数值)
数值型的以.居多,值得注意的是以下几点:
*- sum, regress, generate 等,会自动忽略缺失值;
*- count, keep 等,则会将 "." 视为一个无穷大的数值
2.标记缺失值
mvdecode x1 x2, mv(-97 -999)批量 将x1和x2中-97到-999之间的数值更换成.
replace x1 ="." if x1== "N/A"
3.查看缺失值
(1)sum看样本观察值和统计的结果是否一致
(2)misstable sum var,会自动列举出缺失变量的统计情况
(3)利用rmiss()函数
egen miss = rmiss(var)
list var miss if miss!=0 //var存在缺失值miss将会不为0
sum var if miss==0 //列出排除缺失值的统计分析
(4)等价于sum var if missing(var)
(5)利用e(sample)函数
先reg y x control
然后fsum var if e(sample)==1 ,stat(N mean sd min max) format(%6.3f) cat() label
4.补充缺失值
help mi
help carryforward
………………………………