文章预览
特约作者:史春奇 数据应用学院 特征选择 (Feature Selection,FS)和 特征抽取 (Feature Extraction, FE)是特征工程(Feature Engineering)的两个重要的方面。 他们之间最大的区别就是 是否生成新的属性 。 FS仅仅对特征 进行排序(Ranking)和选择 , FE更为复杂,需要 重新认识 事物, 挖掘新的角度, 创新性的创立新的属性, 而目前深度学习这么火, 一个很重要的原因是缩减了特征提取的任务。 不过, 目前特征工程依然是各种机器学习应用领域的重要组成部分。 1.为什么要特征选择? 1.1特征选择与分类器性能的关系 一般说来,当固定一个分类器的话, 所选择的特征数量和分类器的效果之间会有一个曲线, 在某个x(1 1.2 为什么特征少了不行? 这个比较直观, 特征少了
………………………………