文章预览
主成分分析 (PCA) 是数据科学家使用的绝佳工具。 它可用于降低特征空间维数并生成不相关的特征。 正如我们将看到的,它还可以帮助你深入了解数据的分类能力。 我们将带你了解如何以这种方式使用 PCA。 提供了 Python 代码片段,完整项目可在GitHub^1上找到。 什么是 PCA? 我们先从理论开始。我不会深入讲解太多细节,因为如果你想了解 PCA 的工作原理,有很多很好的资源^2^3。重要的是要知道 PCA 是一种降维算法。这意味着它用于减少用于训练模型的特征数量。它通过从许多特征中构建主成分 (PC) 来实现这一点。 PC 的构造方式是,第一个 PC(即 PC1)尽可能解释特征中的大部分变化。然后 PC2 尽可能解释剩余变化中的大部分变化,依此类推。PC1 和 PC2 通常可以解释总特征变化的很大一部分。另一种思考方式是,前两个 PC 可以很好地总结特征。这很
………………………………