专栏名称: 机器学习初学者
号主黄博Github全球排名前90,3.6万Star!致力于为初学者提供学习路线和基础资料,公众号可以当作随身小抄,文章很全,建议收藏!点击菜单可以进入学习!
今天看啥  ›  专栏  ›  机器学习初学者

【机器学习】集成学习代码练习(随机森林、GBDT、XGBoost、LightGBM等)

机器学习初学者  · 公众号  ·  · 2024-08-20 12:00
    

文章预览

本文是中国大学慕课《机器学习》的“集成学习”章节的课后代码。 课程地址: https://www.icourse163.org/course/WZU-1464096179 课程完整代码: https://github.com/fengdu78/WZU-machine-learning-course 代码修改并注释:黄海广,haiguang2000@wzu.edu.cn import  warnings warnings.filterwarnings( "ignore" ) import  pandas  as  pd from  sklearn.model_selection  import  train_test_split   生成数据 生成12000行的数据,训练集和测试集按照3:1划分 from  sklearn.datasets  import  make_hastie_10_2 data, target = make_hastie_10_2() X_train, X_test, y_train, y_test = train_test_split(data, target, random_state= 123 ) X_train.shape, X_test.shape ((9000, 10), (3000, 10)) 模型对比 对比六大模型,都使用默认参数 from  sklearn.linear_model  import  LogisticRegression from  sklearn.ensemble  import  RandomForestClassifier from  sklearn.ensemble  import  AdaBoostClassifier from  sklearn.ensemb ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览