文章预览
BE声明学写文章② 往期回顾 REVIEWS 1)机器学习|第1期. 一图get机器学习基本流程 2) 机器学习|第2期. 你该知道的数据预处理实战① 上一期我们带大家入门机器学习的数据预处理实战 ①,希望大家对数据预处理有一定的掌握!本期我们继续剖析常见的数据预处理知识及R语言实战,相信大家会有所体会与收获。 前一篇文章提到了数据缺失值处理 (包括删除、填补、预测填补),数据重复项删减和异常值处理,详情见上篇文章!本文将重点介绍数据预处理的其他关键步骤,包括 数据转换、特征选择与构造、数据分割 等,下面我们一一展开叙述。 01 数据转换 数据转换指的是对数据进行标准化或归一化处理,以便不同特征之间可比;对分类变量进行编码,而对数值型数据进行离散化等。 1 数据标准化 标准化可以将特征缩放到同一尺度,常用的是 z
………………………………