如何检验数据是否服从正态分布.doc

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如何检验数据是否服从正态分布

一、图示法

1、 P-P 图

以样本的累计频率作为横坐标, 以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。 如果资料服从整体分布, 则样本点应围绕第一象限的对角线分布。

2、 Q-Q 图

以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐

标,把样本表现为指教坐标系的散点。 如果资料服从正态分布, 则样本点应该呈一条围绕第一象限对角线的直线。

以上两种方法以 Q-Q 图为佳,效率较高。

3、直方图

判断方法:是否以钟形分布,同时可以选择输出正态性曲线。

4、箱式图

判断方法:观测离群值和中位数。

5、茎叶图

类似与直方图,但实质不同。

二、计算法

1、偏度系数( Skewness )和峰度系数( Kurtosis )

计算公式:

g 1 表示偏度, g 2 表示峰度,通过计算 g1 和 g2 及其标准误 σ g1 及 σ g2 然后作 U 检验。两种检验同时得出 U0.05 的结论时,才可以认为该组

资料服从正态分布。由公式可见,部分文献中所说的“偏度和峰度都接近 0 可以认为 近似服从正态分布”并不严谨。

2、非参数检验方法

非参数检验方法包括 Kolmogorov-Smirnov 检验(D 检验)和 Shapiro- Wilk (W

检验)。

≤ 时 结果以 Shapiro –Wilk 检验 为准 SAS 中规定:当样本含量 n , ( W ) , 当样本含量 时 2000 检验 n >2000 , 结果以 Kolmogorov –Smirnov ) 为准。

( D

SPSS 中则这样规定:( 1)如果指定的是非整数权重,则在加权样本大小位 于 3 和 50 之间时,计算 Shapiro-Wilk 统计量。对于无权重或整数权重,在加权样本大小位于 3 和 5000 之间时,计算该统计量。由此可见,部分 SPSS 教材里面关于“ Shapiro – Wilk 适用于样本量 3-50 之间的数据”的说法是在是理解片面,误人子弟。( 2)单样本 Kolmogorov-Smirnov 检验可用于检验变量(例如income )是否为正态分布。

对于此两种检验,如果 P 值大于 0.05,表明资料服从正态分布。

三、 SPSS 操作示例

SPSS中有很多操作可以进行正态检验,在此只介绍最主要和最全面最方便

的操作:

1、工具栏 --分析—描述性统计—探索性

2、选择要分析的变量,选入因变量框内,然后点选图表,设置输出茎叶图

和直方图,选择输出正态性检验图表,注意显示(Display)要选择双项( Both)。

3、 Output 结果

(1)Descriptives:描述中有峰度系数和偏度系数,根据上述判断标准,数

据不符合正态分布。

S k=0,K u=0 时,分布呈正态, Sk>0 时,分布呈正偏态, Sk<0 时,分布呈负偏态,时, Ku>0 曲线比较陡峭, Ku<0 时曲线比较平坦。由此可判断本数据分布

为正偏态(朝左偏),较陡峭。

(2)Tests of Normality : D 检验和W检验均显示数据不服从正态分布,当然在此,数据样本量为 1000,应以 W 检验为准。

(3)直方图

直方图验证了上述检验结果。

(4)此外还有茎叶图、 P-P 图、 Q-Q 图、箱式图等输出结果,不再赘述。结果同样验证数据

不符合正态分布。