专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

泊松自助法(Poisson Bootstrap Sampling):大型数据集上的自助抽样

数据派THU  · 公众号  · 大数据  · 2024-09-02 17:00
    

文章预览

来源 :DeepHub IMBA 本文 约4500字 ,建议阅读 10+ 分钟 经典自助抽样是一种非常有效的技术,可以用于从收集的样本中学习统计量的分布。 自助抽样可以根据收集的样本推断总体的统计特征(如均值、十分位数、置信区间)。泊松自助抽样(Poisson Bootstrap Sampling)是一种用于统计分析中的重采样技术,特别是在机器学习和数据科学中用于模型评估和误差估计。这种方法的一个特点是保留了样本中数据点出现的自然波动,而不是像传统的自助法那样平均采样,因此在某些特定应用中更为准确。 为了深入研究泊松自助法,我们首先来介绍经典的自助抽样方法。 经典自助抽样 假设我们想计算一所学校学生的平均年龄。我们可以重复抽取100名学生的样本,计算平均值并存储。然后对这些样本均值取最终平均值。这个最终平均值是总体平均值的估计。 但是在实际 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览