文章预览
使用scikit-learn进行机器学习 1.无监督学习 从未标记的数据中发现隐藏的模式,例如聚类。 2.监督学习 预测值是已知的,分析的目的是根据特征预测未见过的数据的目标值 监督式学习的类型: 分类: 目标变量是分类型数据 回归: 目标变量是连续型数据 3.命名约定 feature = predictor variable = independent variable (特征 = 预测变量 = 自变量 ) Target variable = dependent variable = response variable (目标变量 = 因变量 = 响应变量) 4.数据要求 无缺失值 numeric格式的数据 数据存储在 pandas DataFrame 或 NumPy array中 先执行探索性数据分析 (EDA) 5.scikit-learn 的一般语法 (不是可以直接运行的代码) from sklearn.module import Model model = Model() model.fit(X, y) predictions = model.predict(X_new) print(predictions) ## array([0, 0, 0, 0, 1, 0]) 算是又开启了一段新的学习历程。同时开启python的单
………………………………