文章预览
点击上方 “ 小白学视觉 ”,选择加" 星标 "或“ 置顶 ” 重磅干货,第一时间送达 作者 | Guillermina Sutter Schneider 编译 | VK 来源 | Towards Data Science PCA是一种常用于处理多重共线性的特征提取方法。在这种情况下,PCA的最大优点是,在应用它之后,每个“新”变量将彼此独立。 本节基于mattbrems的这篇文章:https://towardsdatascience.com/a-one-stop-shop-for-principal-component-analysis-5582fb7e0b。我将一步一步地解释如何只使用numpy(以及使用一点pandas来操作数据帧)来进行PCA。 第1步 首先清理数据集非常重要。因为这不是本文的目标,你可以去仓库看看我做了什么:https://github.com/glosophy/WindPowerForecasting/blob/main/windPowerPCA.ipya 第2步 将数据分为因变量(Y)和特征或自变量(X)。 import pandas as pd features = [ 'WindSpeed' , 'RotorRPM' , 'ReactivePower' , 'GeneratorWinding1Temperature' ,
………………………………