文章预览
unset unset 什么是半监督机器学习? unset unset 半监督学习是一种训练数据中部分样本没有标签的情况。 sklearn.semi_supervised 中的半监督估计器能够利用这些额外的无标签数据,更好地捕捉底层数据分布的形状,并更好地泛化到新样本。当我们只有很少的有标签点和大量无标签点时,这些算法能够表现良好。 在使用 fit 方法训练模型时,重要的是为未标记的点分配一个标识符与已标记的数据一起使用。本实现使用的标识符是整数值-1。注意,对于字符串标签, y 的dtype应该是对象(object),以便它可以同时包含字符串和整数。 unset unset 半监督学习的假设 unset unset 半监督学习算法需要对数据集的分布做出一些假设,以实现性能提升。为了利用无标签数据,必须存在一些与数据底层分布相关的关系。 半监督学习算法利用以下至少一个假设: 连续性/平滑性
………………………………