专栏名称: 朝阳35处
互联网金融大数据挖掘哪家强,平安前海征信帮你忙。分享数据挖掘和人工智能前沿技术,探讨其在风险控制、反欺诈等金融业务中的实际应用。每周涨点知识,多点谈资,定期举办行业沙龙。
今天看啥  ›  专栏  ›  朝阳35处

如何衡量变量之间的相关性?

朝阳35处  · 公众号  ·  · 2018-03-26 10:24
编辑推荐在数据分析工作中,大家一定经常用到Pearson相关系数来判断变量的相关性,不过,任何理论与方法必然都有自己的局限性,相关系数也并不适用于所有情境。本期我们就请团队中的一位统计学博士介绍另外两个判断指标,希望能为大家拓宽一点思路:) 我们都知道,大数据的机遇和挑战主要有三个方向:海量、高速与多样性。在我们获取到的海量数据中,与目标变量可能相关的影响变量自然也很多。那么,有必要全部的变量都放进来分析吗?在数据分析的建模过程中,如何对变量进行取舍?在变量的选择中,又用什么来衡量变量之间相关性的强弱程度呢?在实际的数据分析工作中,我们通常需要同时结合技术和业务两方面来判断变量之间的相关程度, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照