文章预览
统计学最重要的10个概念【附代码解析】 1. 平均值 平均值是一组数据的算术平均数,计算方法是将所有数值相加后除以数据的总数。它是最常用的集中趋势度量,但容易受极端值影响。 import numpy as np data = [ 1 , 2 , 3 , 4 , 5 ] mean = np.mean(data) print( f"数据: {data} " ) print( f"平均值: {mean} " ) 输出结果: 数据: [1, 2, 3, 4, 5] 平均值: 3.0 平均值3.0代表了这组数据的中心位置。 2. 中位数 中位数是将数据排序后处于中间位置的值。对于奇数个数据,中位数是最中间的数;对于偶数个数据,中位数是中间两个数的平均值。中位数不受极端值影响,因此在存在异常值时比平均值更稳定。 data = [ 1 , 3 , 5 , 7 , 9 , 11 ] median = np.median(data) print( f"数据: {data} " ) print( f"中位数: {median} " ) data_odd = [ 1 , 3 , 5 , 7 , 9 ] median_odd = np.median(data_odd) p
………………………………