文章预览
今天和大家一起学习使用 lazypredict 库,我们可以用一行代码在我们的数据集上实现许多 ML 模型,这样我们就可以简要了解哪些模型适合我们的数据集。 步骤1 使用以下方法安装 lazypredict 库: pip install lazypredict 第2步 导入 pandas 来加载我们的数据集。 import pandas as pd 第3步 加载数据集。 df = pd.read_csv( 'Mal_Customers.csv' ) 第4步 打印数据集的前几行 这里 Y 变量是支出分数列,而其余列是 X 变量。 现在,在确定了 X 和 Y 变量之后,我们将它们分成训练和测试数据集。 # 导入 train_test_split,用于分割数据集 from sklearn.model_selection import train_test_split # 定义 X 和 y 变量 X = df.loc[:, df.columns != 'Spending Score (1-100)' ] y = df[ 'Spending Score (1-100)' ] # 对数据进行分区。 # 分割数据 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size= 0.3 ) 第5
………………………………