总结正态性检验的几种方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

总结正态性检验的几种方法
1.1 正态性检验方法
1)偏度系数
样本的偏度系数(记为1g )的计算公式为
()233133
1(1)(2)(1)(2)n i
i n n g x x n n s n n s μ==-=----∑, 其中s 为标准差,3μ为样本的3阶中心距,即()331
1n i i x x n μ==-∑。

偏度系数是刻画数据的对称性指标,关于均值对称的数据其偏度系数为0,右侧更分散的数据偏度系数为正,左侧更分散的数据偏度系数为负。

(2)峰度系数
样本的峰度系数(记为2g ),计算公式为
()2424
122
44(1)(1)3(1)(2)(3)(2)(3)(1)(1)3(1)(2)(3)(2)(3)n i i n n n g x x n n n s n n n n n n n n s n n μ=+-=-------+-=------∑,
其中s 为标准差,4μ为样本的3阶中心距,即()441
1n i i x x n μ==-∑。

当数据的总体分布为正态分布时,峰度系数近似为0,;当分布为正态分布的尾部更分散时,峰度系数为正;否则为负。

当峰度系数为正时,两侧极端数据较多,当峰度系数为负时,两侧极端数据较少。

(3)QQ 图
QQ 图可以帮助我们鉴别样本的分布是否近似于某种类型的分布。

现假设总体为正态分布()2
,N μσ,对于样本12,,,n x x x L ,其顺序统计量是(1)(2)(),,,n x x x L 。

设()x Φ为标准正
态分布()0,1N 的分布函数,1
()x -Φ是反函数,对应正态分布的QQ 图是由以下的点 1()0.375,,1,2,,0.25i i x i n n -⎛⎫-⎛⎫Φ= ⎪ ⎪+⎝⎭⎝⎭
L , 构成的散点图,若样本数据近似为正态分布,在QQ 图上这些点近似地在直线上
y x σμ=+,
附近,此直线的斜率是标准差σ,截距式均值,μ,所以利用正态QQ 图可以做直观的正态性检验。

若正态QQ 图上的点近似地在一条直线上,可以认为样本的数据来自正态分布总
体。

(4) 正态性W 检验
Shapiro-Wilk 检验法是S.S.Shapiro 与M.B.Wilk 提出用顺序统计量W 来检验分布的正态性,对研究的对象总体,先提出假设认为总体服从正态分布,再将样本量为n 的样本按大小顺序排列编秩,然后由确定的显著性水平α,以及根据样本量为n 时所对应的系数i α,根据公式
()
2()121n i i i n i
i a x W x x ==⎛⎫ ⎪⎝
⎭=-∑∑ 计算出检验统计量W 。

最后查特定的正态性W 检验临界值表,比较它们的大小,满足条件则接受假设,认为总体服从正态分布,否则拒绝假设,认为总体不服从正态分布。

1.2 代码实现
本题从从网站/faculty/hadi/RABE5/#Download 下载数据
2.3 结果分析
(1)偏度系数
利用偏度系数对表1中的51个数据进行正态性检验,其算得样本的偏度系数为2.28209,说明职工销售额右侧更加分散。

从而,该样本不是正态分布。

(2)峰度系数
利用峰度系数对表1中的51个数据进行正态性检验,其算得样本的峰度系数为7.906113,说明职工销售额的正态分布的尾部更分散,两侧极端数据较多。

从而,该样本不是正态分布。

(3)QQ图
利用QQ图鉴别样本的分布是否近似于某种类型的分布。

从图1可看出,正态QQ图上的点没在一条直线上,可以认为样本的数据来自不是正态分布总体。

图1 正态性检验QQ图
(4) 正态性W检验
α,利用函数shapiro.test( )算的利用W检验验证分布的正态性,假设显著性水平=0.05
W值为0.79665, P = 6.039e-07,可明显看出P<α,说明该样本总体不服从正态分布。

相关文档
最新文档