文章预览
这是特征工程的最终篇章,没看过第1第2部分的可以点击图片查看。 第1部分 (点击即可跳转) 第2部分(点击即可跳转) 在特征工程的最后部分我们将深入探讨特征选择,这也是解决维度灾难非常有效的方法。 特征选择 特征选择就像是去相亲:你得找到那些与你的模型最合拍的特征(即你的“伴侣”),然后祈祷它们能一拍即合。 “特征选择,是指在数据集中识别并选出对预测目标变量最为重要的特征的过程。” 特征选择主要有三种技术: 过滤法 包装法 嵌入法 过滤法 过滤法就像购物,我们在店里试穿各种衣服,相互比较,试图决定哪一件最好。 正如购物需要时间,过滤法也会犹豫不决,需要一段时间才能选出最适合任务的特征。 “过滤法基于统计度量来选择特征,每次关注一个特征,并与其他特征进行比较,特征的选择不依赖于学习算法
………………………………