第四章 第五节 分布的偏度与峰度
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五节 分布的偏度与峰度
分布的偏态测度 矩偏度系数 皮尔逊偏度系
数 分布的尖锐度测度
峰度
精品课件
➢ 矩偏度系数(Coefficient of Skewness)
两组资料虽然平均数与标准差皆相同,却可能由于各自不同的偏斜情 况,使得次数分配的形状不相同。
矩也称为动差。以零为中心矩称为原点k阶矩,基本形式为:
n
xk fi
mk
i1 n
fi
i1
当k=1时,就是算术平均数,即1阶原点矩就是算术平均数。
精品课件
如果将原点移至算术平均数得位置,可以得到以平均数为中心的k 阶中心矩:
n
(x i x )k f i
m k i1 n
fi
i 1
当k=0时,零阶中心矩 当k=1时,一阶中心矩 当k=2时,二阶中心矩
U0 1 U1 0
U2 2
也即方差。
精品Baidu Nhomakorabea件
矩偏度是以变量的三阶中心动差除以标准差三次方,来衡量分布不对 称程度,或偏斜程度的指标。即三阶中心动差以为标准单位的系数。公式如 下:
n
m3 σ3
(xi x)3 fi
i 1
n
σ3 fi
i 1
当频数分布为正态时,变量值得频数以平均数左右完全对称,三阶动差等于0 ,偏度也为0;
n
m4 σ4
(xi
i 1
σ4
x)4 fi
n
fi
3
i 1
峰度指标是以正态分布的峰度为比较标准(正态分布的峰度β=0),来比较
不同频数分布的尖峭程度。
当峰度β>0时,表示频数分布比正态分布更集中,分布呈尖峰状态,平均数 代表性更高;
当β<0时,表示频数分布比正态分布更分散,分布呈平坦峰,平均数代表性 较低。
精品课件
样本的峰度系数计算公式:
(n 1 )n n ((n 2 1 ))n ( 3 ) m 4 4(n 3 (n 2 ) n 1 () 23 )
0 0
0
精品课件
例 随着信息化时代的到来,越来越多的人选择在家办公, 下面的样本资料是在家办公的人的年龄:
22 58 24 50 29 52 57 31 30 29 41 44 40 46 29 31 37 42 44 49
当α>0时,为正偏斜(即右偏,分布曲线右尾端较厚)
当α<0时,为负偏斜(即左偏,分布曲线左尾端较厚)。
精品课件
样本的矩偏度系数计算公式:
(n1)n n (2) m 3 3(n1)n n (2)a3
0
0
0
精品课件
➢ 皮尔逊偏度系数(Pearson )
Pearson偏态系数以平均值与中位数或众数之差与标准差之比来衡量偏斜 的程度,用SK表示偏斜系数。这是根据众数、中位数与均值各自的性质,通 过比较众数或中位数与均值来衡量偏斜度的。其计算公式为:
n
m σ44
(xi x)4
i1
nσ4
31.28
因此,样本数据均值为39.25岁,称右偏,比峰度较正态分布平坦。
精品课件
SK3(xMe)或3( xMo)
σ
σ
偏态系数小于0,因为平均数在众数之左,是一种左偏的分布,又称为负 偏。
偏态系数大于0,因为均值在众数之右,是一种右偏的分布,又称为正偏 。
精品课件
➢ 峰度( Kurtosis )
峰度是以变量的四阶中心动差除以标准差的四次方,并将结果再减去3, 用来衡量频数分布的集中程度,也是衡量分布曲线尖峭程度的指标。公式为:
1、根据样本资料离散系数; 2、确定样本资料的偏度系数和峰度系数;
精品课件
n
x i1 xi 78539.25 n 20
xx2 22.7 15 3
S
1.0 79
n1
19
V S 10 % 01.7 0 5 10 % 0 2.3 7% 9
x
3.2 95
n
m σ33
(xi x)3
i1
nσ3
0.125
分布的偏态测度 矩偏度系数 皮尔逊偏度系
数 分布的尖锐度测度
峰度
精品课件
➢ 矩偏度系数(Coefficient of Skewness)
两组资料虽然平均数与标准差皆相同,却可能由于各自不同的偏斜情 况,使得次数分配的形状不相同。
矩也称为动差。以零为中心矩称为原点k阶矩,基本形式为:
n
xk fi
mk
i1 n
fi
i1
当k=1时,就是算术平均数,即1阶原点矩就是算术平均数。
精品课件
如果将原点移至算术平均数得位置,可以得到以平均数为中心的k 阶中心矩:
n
(x i x )k f i
m k i1 n
fi
i 1
当k=0时,零阶中心矩 当k=1时,一阶中心矩 当k=2时,二阶中心矩
U0 1 U1 0
U2 2
也即方差。
精品Baidu Nhomakorabea件
矩偏度是以变量的三阶中心动差除以标准差三次方,来衡量分布不对 称程度,或偏斜程度的指标。即三阶中心动差以为标准单位的系数。公式如 下:
n
m3 σ3
(xi x)3 fi
i 1
n
σ3 fi
i 1
当频数分布为正态时,变量值得频数以平均数左右完全对称,三阶动差等于0 ,偏度也为0;
n
m4 σ4
(xi
i 1
σ4
x)4 fi
n
fi
3
i 1
峰度指标是以正态分布的峰度为比较标准(正态分布的峰度β=0),来比较
不同频数分布的尖峭程度。
当峰度β>0时,表示频数分布比正态分布更集中,分布呈尖峰状态,平均数 代表性更高;
当β<0时,表示频数分布比正态分布更分散,分布呈平坦峰,平均数代表性 较低。
精品课件
样本的峰度系数计算公式:
(n 1 )n n ((n 2 1 ))n ( 3 ) m 4 4(n 3 (n 2 ) n 1 () 23 )
0 0
0
精品课件
例 随着信息化时代的到来,越来越多的人选择在家办公, 下面的样本资料是在家办公的人的年龄:
22 58 24 50 29 52 57 31 30 29 41 44 40 46 29 31 37 42 44 49
当α>0时,为正偏斜(即右偏,分布曲线右尾端较厚)
当α<0时,为负偏斜(即左偏,分布曲线左尾端较厚)。
精品课件
样本的矩偏度系数计算公式:
(n1)n n (2) m 3 3(n1)n n (2)a3
0
0
0
精品课件
➢ 皮尔逊偏度系数(Pearson )
Pearson偏态系数以平均值与中位数或众数之差与标准差之比来衡量偏斜 的程度,用SK表示偏斜系数。这是根据众数、中位数与均值各自的性质,通 过比较众数或中位数与均值来衡量偏斜度的。其计算公式为:
n
m σ44
(xi x)4
i1
nσ4
31.28
因此,样本数据均值为39.25岁,称右偏,比峰度较正态分布平坦。
精品课件
SK3(xMe)或3( xMo)
σ
σ
偏态系数小于0,因为平均数在众数之左,是一种左偏的分布,又称为负 偏。
偏态系数大于0,因为均值在众数之右,是一种右偏的分布,又称为正偏 。
精品课件
➢ 峰度( Kurtosis )
峰度是以变量的四阶中心动差除以标准差的四次方,并将结果再减去3, 用来衡量频数分布的集中程度,也是衡量分布曲线尖峭程度的指标。公式为:
1、根据样本资料离散系数; 2、确定样本资料的偏度系数和峰度系数;
精品课件
n
x i1 xi 78539.25 n 20
xx2 22.7 15 3
S
1.0 79
n1
19
V S 10 % 01.7 0 5 10 % 0 2.3 7% 9
x
3.2 95
n
m σ33
(xi x)3
i1
nσ3
0.125