专栏名称: InfoTech
以传播大数据、解读行业趋势、数据化运营为核心的新媒体平台,已有150多万行业人士关注,荣获2013年新浪微博百强自媒体、2016年中国十大大数据领域影响力平台,关注我就是关注数据
今天看啥  ›  专栏  ›  InfoTech

强文!看懂数据探索,完整指导!

InfoTech  · 公众号  · 大数据  · 2017-06-17 00:02
翻译/编辑/部分原创 Vivian Ouyang  原作者:Sunil Ray     数据圈资深成员作者简介:美国达拉斯一家医院数据中心工作,职位是data scientist。主要做healthcare方面的数据分析建模在机器学习中,很多时候你会挣扎于怎么提高模型的准确率。在这种时刻,数据探索的一些方法将帮助你解决这个问题。这个指导将帮助你理解数据探索中的主要技术。请记住你输入的变量的数据质量决定了你模型输出量的质量。所以当你的商业问题提出来以后,你需要花费很多时间在数据准备和探究上面,一般来说,数据清理,探究和准备大概占据了一个项目70%的时间。下面是准备,理解,清理你用于建立预测模型的数据的几个步骤,我会一个一个来介绍1.变量确定2.单变量分析3.双变量分析4. ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照