文章预览
有时候,数据看起来很漂亮,但其实背后隐藏了许多陷阱 。 今天我们来聊聊数学史上一组非常有趣的例子—— 安斯库姆四重奏 (Anscombe's Quartet),看看它是如何揭示数据分析中的微妙陷阱的。 安斯库姆四重奏 安斯库姆四重奏是由统计学家弗朗西斯·安斯库姆(Francis Anscombe)于1973年提出的一组特殊的数据集。 这组数据由四个不同的二维数据集组成,每个数据集都包含11对数据点 。乍一看,这没什么特别呀。 序号 x1 y1 x2 y2 x3 y3 x4 y4 1 10 8.04 10 9.14 10 7.46 8 6.58 2 8 6.95 8 8.14 8 6.77 8 5.76 3 13 7.58 13 8.74 13 12.74 8 7.71 4 9 8.81 9 8.77 9 7.11 8 8.84 5 11 8.33 11 9.26 11 7.81 8 8.47 6 14 9.96 14 8.10 14 8.84 8 7.04 7 6 7.24 6 6.13 6 6.08 8 5.25 8 4 4.26 4 3.10 4 5.39 8 5.56 9 12 10.84 12 9.13 12 8.15 8 7.91 10 7 4.82 7 7.26 7 6.42 8 6.89 11 5 5.68 5 4.74 5 5.73 19 12.50 这四个数据集在以下几个方面都有几乎完全相同的统计
………………………………