正态性检验的几种方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态性检验的几种方法
一、引言
正态分布是自然界中一种最常见的也是最重要的分布。因此,人们在实际使用统计分析时,总是乐于正态假定,但该假定是否成立,牵涉到正态性检验。目前,正态性检验主要有三类方法:一是计算综合统计量,如动差法、Shapiro-Wilk 法(W 检验)、D ’Agostino 法(D 检验)、Shapiro-Francia 法(W ’检验)。二是正态分布的拟合优度检验,如2χ检验、对数似然比检验、Kolmogorov-Smirov 检验。三是图示法(正态概率图Normal Probability plot),如分位数图(Quantile Quantile plot ,简称QQ 图)、百分位数(Percent Percent plot ,简称PP 图)和稳定化概率图(Stablized Probability plot ,简称SP 图)等。而本文从不同角度出发介绍正态性检验的几种常见的方法,并且就各种方法作了优劣比较,还进行了应用。
二、正态分布
2.1 正态分布的概念
定义1若随机变量X 的密度函数为
()()()+∞∞-∈=
--
,,21
2
2
2x e x f x σμπ
σ
其中μ和σ为参数,且()0,,>+∞∞-∈σμ
则称X 服从参数为μ和σ的正态分布,记为()2,~σμN X 。
另我们称1,0==σμ的正态分布为标准正态分布,记为()1,0~N X ,标准正态分布随机变量的密度函数和分布函数分别用()x ϕ和()x Φ表示。
引理1 若()2,~σμN X ,()x F 为X 的分布函数,则()⎪⎭
⎫
⎝⎛-Φ=σμx x F
由引理可知,任何正态分布都可以通过标准正态分布表示。
2.2 正态分布的数字特征
引理2 若()2,~σμN X ,则()()2,σμ==x D x E 引理3 若()2,~σμN X ,则X 的n 阶中心距为
()()N k k
n k k n k
n ∈⎩⎨
⎧=-+==2,
!!1212,02σμ
定义2 若随机变量的分布函数()x F 可表示为:
()()()()x F x F x F 211εε+-= ()10<≤ε
其中()x F 1为正态分布()2
1,σμN 的分布函数,()x F 2为正态分布()
2
2,σμN 的分
布函数,则称X 的分布为混合正态分布。
注:引理1、2、3的证明见参考文献[1]和[2]。
三、几种常见的正态性检验及其应用
3.1 计算综合统计量法
3.1.1 Shapiro-Wilk 检验(W 检验) 1.W 检验的一般步骤
Shapiro-Wilk 检验在大多数情况下具有很高的效能和综合性。检验的基本步骤如下:
1)建立原假设0H :X 服从正态分布
2)把从总体中获得的n 个样本观测值按由小到大的次序排列成:
()()()n x x x ≤≤≤ (21)
3)选择恰当的统计量W 为:
()()()[]()∑∑=-+⎥⎦⎤⎢⎣⎡=⎥
⎦⎤⎢⎣
⎡-⎪
⎭⎪⎬⎫⎪⎩⎪⎨⎧-=n i i i i n n i i x x x x w a W 12_
2
121 式中[]2/n 表示2/n 的整数部分,系数()W a i 可查W 检验的系数表,[]2/n 表示数2/n 的整数部分。
4)根据给定的检验水平α和样本容量n 查W 检验统计量W 的p 分位数得统
计量W 的α分位数αW 。
5)计算并判断:给定样本值1x ,…,n x ,计算W 并与αW 比较,若αW W <则拒绝0H ,反之,则不能拒绝0H 。
注:有关W 检验的原理及W 检验的系数及分位数表见参考文献[5]。
2.W 检验的应用
抽查用克矽平治疗的矽肺患者10名,得他们治疗前后血红蛋白的差(单位:克%)如下:2。7,-1。2,-1。0,0,0。7,2。0,3。7,-0。6,0。8,-0。3,试用W 检验检验治疗前后血红单倍的差是否服从正态分布。
把题中的数据按由小到大的次序排好填入表1
表1 患者血红蛋白差值表
i ()i x ()i x -11 ()()i i x x --11
()W α 1 -1.2 3.7 4.9 0.5733 2 -1.0 2.7 3.7 0.3291 3 -0.6 2.0 2.6 0.2141 4 -0.3 0.8 1.1 0.1224 5
0.7
0.7
0.0399
把表的数据代入公式()()()[]()∑∑=-+⎥⎦⎤⎢⎣⎡=⎥
⎦⎤⎢⎣
⎡-⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-=n i i i i n n i i x x x x w a W 12_
2
121,经计算得9251.0=W 。 若取05.0=α,查统计量W 的α分位数表得10=n 时,842.0=αW ,因为
αW W >,所以不拒绝原假设。
虽然W 检验是一种有效地正态性检验方法,但它一般只适用于容量为3至50的样本,随着n 的增大,一般用于计算分位数的分布拟合的技术不能使用。
3.1.2 D ’Agostino 检验 (D 检验)
D ’Agostino 检验适合测量次数较多的情况,检验统计量为
()()
∑∑
==-⎪⎭⎫
⎝⎛+-=
n
i i n
i i X
X n X n i D 122/31
21 在零假设为真时,