专栏名称: Python开发者
人生苦短,我用 Python。伯乐在线旗下账号「Python开发者」分享 Python 相关的技术文章、工具资源、精选课程、热点资讯等。
目录
今天看啥  ›  专栏  ›  Python开发者

机器学习中的样本重要性权重 (Importance Weight)

Python开发者  · 公众号  · Python  · 2024-09-02 08:30

文章预览

样本 重要性权重 (Importance Weighting, IW)是一种在机器学习中应对「 训练-测试数据分布不一致 」问题的经典方法,通过对样本给予合适的权重,理论上我们可以在分布不一致的情况下,学出在目标分布上的无偏估计。 unset unset 简单理论推导 unset unset 假设训练集样本 来自于分布 ,我们称该分布为 原始分布 (Source Distribution),在该分布上我们要学习某个函数 ,从而在某个 目标分布 (Target Distribution) 上进行预测。在目标分布 上对 的估计为: 在原始分布 上对 的估计则为: 要想在原始分布 上能够拟合出在目标分布 上的无偏估计,我们可以通过以下的变换来得到: 可见,对函数 乘上一个权重 ,然后再在原始分布 上进行估计,就可以得到在目标分布 上的无偏估计,这里的 就是所谓的 样本重要性权重(Importance Weight,IW) 。 也就是说,我 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览