文章预览
这篇文章是特征工程的第二部分,没看过第一部分的可以点击下方图片跳转阅读。 在本文中,我们将深入探讨特征提取,但在之前,我们需要先了解一下令人头疼的“维度灾难”。 维度灾难,是数据分析中的大麻烦。 想象一下,在熙熙攘攘的市场中寻找你需要的摊位, 摊位越多,商品琳琅满目,就越难一眼找到你需要的那个。 同样的道理,当数据中的特征数量激增时,就像市场里的摊位一样,要筛选出那些真正有价值、重要的特征就变得格外费力。 “维度灾难发生在数据集包含过多特征时,导致机器学习算法难以识别出关键特征。” 那么,如何应对这一难题呢?我们可以采用一种叫做“降维”的技术。 “降维是通过减少特征数量或维度来简化数据集的过程,旨在提高机器学习模型的效率和准确性。” 降维主要有两种方式: 特征提取 特征选
………………………………