专栏名称: Coggle数据科学
Coggle全称Communication For Kaggle,专注数据科学领域竞赛相关资讯分享。
今天看啥  ›  专栏  ›  Coggle数据科学

Kaggle知识点:半监督机器学习

Coggle数据科学  · 公众号  ·  · 2024-07-25 09:04

文章预览

unset unset 什么是半监督机器学习? unset unset 半监督学习是一种训练数据中部分样本没有标签的情况。 sklearn.semi_supervised 中的半监督估计器能够利用这些额外的无标签数据,更好地捕捉底层数据分布的形状,并更好地泛化到新样本。当我们只有很少的有标签点和大量无标签点时,这些算法能够表现良好。 在使用 fit 方法训练模型时,重要的是为未标记的点分配一个标识符与已标记的数据一起使用。本实现使用的标识符是整数值-1。注意,对于字符串标签, y 的dtype应该是对象(object),以便它可以同时包含字符串和整数。 unset unset 半监督学习的假设 unset unset 半监督学习算法需要对数据集的分布做出一些假设,以实现性能提升。为了利用无标签数据,必须存在一些与数据底层分布相关的关系。 半监督学习算法利用以下至少一个假设: 连续性/平滑性 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览