正态性检验的几种方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

正态性检验的几种方法

一、引言

正态分布是自然界中一种最常见的也是最重要的分布。因此,人们在实际使用统计分析时,总是乐于正态假定,但该假定是否成立,牵涉到正态性检验。目前,正态性检验主要有三类方法:一是计算综合统计量,如动差法、Shapiro-Wilk 法(W 检验)、D ’Agostino 法(D 检验)、Shapiro-Francia 法(W ’检验)。二是正态分布的拟合优度检验,如2χ检验、对数似然比检验、Kolmogorov-Smirov 检验。三是图示法(正态概率图Normal Probability plot),如分位数图(Quantile Quantile plot ,简称QQ 图)、百分位数(Percent Percent plot ,简称PP 图)和稳定化概率图(Stablized Probability plot ,简称SP 图)等。而本文从不同角度出发介绍正态性检验的几种常见的方法,并且就各种方法作了优劣比较,还进行了应用。

二、正态分布

2.1 正态分布的概念

定义1若随机变量X 的密度函数为

()()()+∞∞-∈=

--

,,21

2

2

2x e x f x σμπ

σ

其中μ和σ为参数,且()0,,>+∞∞-∈σμ

则称X 服从参数为μ和σ的正态分布,记为()2,~σμN X 。

另我们称1,0==σμ的正态分布为标准正态分布,记为()1,0~N X ,标准正态分布随机变量的密度函数和分布函数分别用()x ϕ和()x Φ表示。

引理1 若()2,~σμN X ,()x F 为X 的分布函数,则()⎪⎭

⎝⎛-Φ=σμx x F

由引理可知,任何正态分布都可以通过标准正态分布表示。

2.2 正态分布的数字特征

引理2 若()2,~σμN X ,则()()2,σμ==x D x E 引理3 若()2,~σμN X ,则X 的n 阶中心距为

()()N k k

n k k n k

n ∈⎩⎨

⎧=-+==2,

!!1212,02σμ

定义2 若随机变量的分布函数()x F 可表示为:

()()()()x F x F x F 211εε+-= ()10<≤ε

其中()x F 1为正态分布()2

1,σμN 的分布函数,()x F 2为正态分布()

2

2,σμN 的分

布函数,则称X 的分布为混合正态分布。

注:引理1、2、3的证明见参考文献[1]和[2]。

三、几种常见的正态性检验及其应用

3.1 计算综合统计量法

3.1.1 Shapiro-Wilk 检验(W 检验) 1.W 检验的一般步骤

Shapiro-Wilk 检验在大多数情况下具有很高的效能和综合性。检验的基本步骤如下:

1)建立原假设0H :X 服从正态分布

2)把从总体中获得的n 个样本观测值按由小到大的次序排列成:

()()()n x x x ≤≤≤ (21)

3)选择恰当的统计量W 为:

()()()[]()∑∑=-+⎥⎦⎤⎢⎣⎡=⎥

⎦⎤⎢⎣

⎡-⎪

⎭⎪⎬⎫⎪⎩⎪⎨⎧-=n i i i i n n i i x x x x w a W 12_

2

121 式中[]2/n 表示2/n 的整数部分,系数()W a i 可查W 检验的系数表,[]2/n 表示数2/n 的整数部分。

4)根据给定的检验水平α和样本容量n 查W 检验统计量W 的p 分位数得统

计量W 的α分位数αW 。

5)计算并判断:给定样本值1x ,…,n x ,计算W 并与αW 比较,若αW W <则拒绝0H ,反之,则不能拒绝0H 。

注:有关W 检验的原理及W 检验的系数及分位数表见参考文献[5]。

2.W 检验的应用

抽查用克矽平治疗的矽肺患者10名,得他们治疗前后血红蛋白的差(单位:克%)如下:2。7,-1。2,-1。0,0,0。7,2。0,3。7,-0。6,0。8,-0。3,试用W 检验检验治疗前后血红单倍的差是否服从正态分布。

把题中的数据按由小到大的次序排好填入表1

表1 患者血红蛋白差值表

i ()i x ()i x -11 ()()i i x x --11

()W α 1 -1.2 3.7 4.9 0.5733 2 -1.0 2.7 3.7 0.3291 3 -0.6 2.0 2.6 0.2141 4 -0.3 0.8 1.1 0.1224 5

0.7

0.7

0.0399

把表的数据代入公式()()()[]()∑∑=-+⎥⎦⎤⎢⎣⎡=⎥

⎦⎤⎢⎣

⎡-⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-=n i i i i n n i i x x x x w a W 12_

2

121,经计算得9251.0=W 。 若取05.0=α,查统计量W 的α分位数表得10=n 时,842.0=αW ,因为

αW W >,所以不拒绝原假设。

虽然W 检验是一种有效地正态性检验方法,但它一般只适用于容量为3至50的样本,随着n 的增大,一般用于计算分位数的分布拟合的技术不能使用。

3.1.2 D ’Agostino 检验 (D 检验)

D ’Agostino 检验适合测量次数较多的情况,检验统计量为

()()

∑∑

==-⎪⎭⎫

⎝⎛+-=

n

i i n

i i X

X n X n i D 122/31

21 在零假设为真时,

相关文档
最新文档