文章预览
内容来自:“小白学统计”微信公众号,感谢作者授权 我在审稿一些预测模型开发类文章的时候,经常看到很多文章都是采用大概这种思路: 首先进行单因素分析,筛选出p值小于0.05的变量 (当然,有的文章会设置为小于0.1、0.15等),然后将这些变量纳入多因素分析,再以其中有统计学意义的变量构成一个预测模型。可能不少临床大夫喜欢这种方式,因为简单。但是否合理,这就很难说了。 事实上, 几乎所有的统计学家都明确反对根据p值来构建预测模型 ,这类文献不少(国外的),感兴趣的大家可以搜一下。为什么呢?因为确实不大靠谱。我举个简单例子大家可以看一下: 我曾经分析4个指标(简单的用a、b、c、d表示)与结局的关系,结果发现,d变量的参数估计值和P值在单因素和多因素分析中均差别非常大(下表)。仔细分析原因发现,a、
………………………………