专栏名称: 机器学习初学者
号主黄博Github全球排名前90,3.6万Star!致力于为初学者提供学习路线和基础资料,公众号可以当作随身小抄,文章很全,建议收藏!点击菜单可以进入学习!
今天看啥  ›  专栏  ›  机器学习初学者

机器学习入门基础:机器学习实践

机器学习初学者  · 公众号  ·  · 2024-07-18 12:00

文章预览

目录 7.1 数据集划分 7.1.1 训练集、验证集和测试集划分 7.1.2 交叉验证 7.1.3 不平衡数据处理 7.2 评价指标 7.2.1 回归的评价指标 7.2.2 分类的评价指标 7.2.3 评价指标案例 7.3 正则化、偏差和方差 7.3.1 欠拟合和过拟合 7.3.2 正则化 7.3.3 偏差和方差 参考文献 7.1 数据集划分 7.1.1 训练集、验证集和测试集划分 机器学习的数据,可以划分为训练集、验证集和测试集。 训练集(Training Set):帮助我们训练模型,简单地说就是通过训练集的数据让我们确定拟合曲线的参数。 验证集(Validation Set):也叫做开发集(Dev Set),用来做模型选择(Model Selection),即做模型的最终优化及确定的,用来辅助我们的模型的构建,即训练超参数,可选。 测试集(Test Set):为了测试已经训练好的模型的精确度。 我们将数据分成训练集和测试集,通常用70%的数据作为训练集,用剩下30%的数据 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览