专栏名称: 生信技能树
生物信息学学习资料分析,常见数据格式及公共数据库资料分享。常见分析软件及流程,基因检测及癌症相关动态。
今天看啥  ›  专栏  ›  生信技能树

基于Python的scikit-learn机器学习框架,分类模型的构建和预测

生信技能树  · 公众号  ·  · 2024-09-25 15:54

文章预览

使用scikit-learn进行机器学习 1.无监督学习 从未标记的数据中发现隐藏的模式,例如聚类。 2.监督学习 预测值是已知的,分析的目的是根据特征预测未见过的数据的目标值 监督式学习的类型: 分类:  目标变量是分类型数据 回归:  目标变量是连续型数据 3.命名约定 feature = predictor variable = independent variable (特征 = 预测变量 = 自变量 ) Target variable = dependent variable = response variable (目标变量 = 因变量 = 响应变量) 4.数据要求 无缺失值 numeric格式的数据 数据存储在 pandas DataFrame 或 NumPy array中 先执行探索性数据分析 (EDA) 5.scikit-learn 的一般语法 (不是可以直接运行的代码) from  sklearn.module  import  Model model = Model() model.fit(X, y) predictions = model.predict(X_new) print(predictions) ## array([0, 0, 0, 0, 1, 0]) 算是又开启了一段新的学习历程。同时开启python的单 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览