文章预览
引言 本周末开课:机器学习方法 11.30-12.1 R语言构建机器学习课程开启,欢迎报名开启 常规机器学习分析的文章大家都看了不少了,今天给大家 分享一篇基于4种不同中国青少年受欺凌的受害者轨迹,使用常见的随机森林(RF)法构建预测模型。 先来看看本文的研究设计吧: 1.数据收集与处理 对于缺失的数值型数据,使用中位数进行填充; 对于缺失的分类型数据,使用众数进行填充; 针对参与者分布不均衡的问题,使用随机过采样法来平衡数据集。 2.轨迹分析——组轨迹模型(GBTM) 基于每次调查的总受害分数,测试了2~5个组的轨迹模型; 通过贝叶斯信息准则(BIC)、赤池信息准则(AIC)和对数似然(LL)确定了最优组数。 3.模型的构建与评估 数据集被分为70%训练集和30%验证集; 使用多个指标评估模型性能,包括 准确性、灵敏度、特异性、阳性
………………………………