第四章 第五节 分布的偏度与峰度
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3( x M e ) 3 (x M o) SK 或 σ σ
偏态系数小于0,因为平均数在众数之左,是一种左偏的分布,又称为负 偏。 偏态系数大于0,因为均值在众数之右,是一种右偏的分布,又称为正偏 。
统计学原理
峰度( Kurtosis )
峰度是以变量的四阶中心动差除以标准差的四次方,并将结果再减去3, 用来衡量频数分布的集中程度,也是衡量分布曲线尖峭程度的指标。公式为:
U0 1
U1 0
U2 2
也即方差。
统计学原理
矩偏度是以变量的三阶中心动差除以标准差三次方,来衡量分布不对称程 度,或偏斜程度的指标。即三阶中心动差以为标准单位的系数。公式如下:
m3 3 σ
3 (x x ) fi i i 1
n
σ 3 fi
i 1
n
当频数分布为正态时,变量值得频数以平均数左右完全对称,三阶动差等于 0,偏度也为0; 当α>0时,为正偏斜(即右偏,分布曲线右尾端较厚)
4 (x x ) fi i i 1 n
m4 4 σ
σ 4 fi
i 1
n
3
峰度指标是以正态分布的峰度为比较标准(正态分布的峰度β=0),来比 较不同频数分布的尖峭程度。
当峰度β>0时,表示频数分布比正态分布更集中,分布呈尖峰状态,平均 数代表性更高;
当β<0时,表示频数分布比正态分布更分散,分布呈平坦峰,平均数代表 性较低。
当α<0时,为负偏斜(即左偏,分布曲线左尾端较厚)。
统计学原理
样本的矩偏度系数计算公式:
m3 n n 3 a3 ( n 1)(n 2) ( n 1)(n 2)
0
0
0
统计学原理
皮尔逊偏度系数(Pearson )
Pearson偏态系数以平均值与中位数或众数之差与标准差之比来衡量偏斜 的程度,用SK表示偏斜系数。这是根据众数、中位数与均值各自的性质,通 过比较众数或中位数与均值来衡量偏斜度的。其计算公式为:
m3 3 σ
(x
i 1
n
i
x )3
3
nσ
n i 1
0.125
m4 4 σ
4 (x x ) i
nσ
4
3 1.28
因此,样本数据均值为39.25岁,称右偏,比峰度较正态分布平坦。
统计学原理
k x fi i 1 n n
mk
f
i 1
i
当k=1时,就是算术平均数,即1阶原点矩就是算术平均数。
统计学原理
如果将原点移至算术平均数得位置,可以得到以平均数为中心的 k 阶中心矩:
mk
(x
i 1
n
i n
x) f i
k i
f
i 1
当k=0时,零阶中心矩 当k=1时,一阶中心矩 当k=2时,二阶中心矩
第五节 分布的偏度与峰度
分布的偏态测度 矩偏度系数 皮尔逊偏度系数 分布的尖锐度测度 峰度
统计学原理
矩偏度系数(Coefficient of Skewness )
两组资料虽然平均数与标准差皆相同,却可能由于各自不同的偏斜情况, 使得次数分配的形状不相同。 矩也称为动差。以零为中心矩称为原点k阶矩,基本形式为:
统计学原理
样本的峰度系数计算公式:
n( n 1) m4 3( n 1)2 4 ( n 1)(n 2)(n 3) ( n 2)(n 3)
0
0
0
统计学原理
Baidu Nhomakorabea
例 随着信息化时代的到来,越来越多的人选择在家办公, 下面的样本资料是在家办公的人的年龄: 22 58 24 50 29 52 57 31 30 29
41
44
40
46
29
31
37
42
44
49
1、根据样本资料离散系数;
2、确定样本资料的偏度系数和峰度系数;
统计学原理
x
x
i 1
n
i
n
785 39.25 20
S
x x n 1
2
2213.75 10.79 19
S 10.75 V 100% 100% 27.39% x 39.25