正态分布检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Shapiro-Wilk 检验含义:Shapiro —Wilk 检验法是S.S.Shapiro 与
M.B.Wilk提出用顺序统计量W来检验分布的正态性,对研究的对象总体先提出假设认为总体服从正态分布,再将样本量为n的样本按大小顺序排列编秩,然后由确定的显著性水平a,以及根据样本量为n时所对应的系数a i,根据特定公式计算出检验统计量W.最后查特定的正态性W检
验临界值表,比较它们的大小,满足条件则接受假设认为总体服从正态分布,否则拒绝假设,认为总体不服从正态分布•
W检验全称Shapiro-Wilk检验,是一种基于相关性的算法。计算可得到一个相关系数,它越接近1就越表明数据和正态分布拟合得越好。
w检验是检验样本容量8< n < 50,样本是否符合正态分布的一种方法。
计算式为:
■
1X1他「球
其检验步骤如下:
①将数据按数值大小重新排列,使x1 ②计算上式分母; ③计算a值,可查表得出; ④计算检验统计量W ; ⑤若W值小于判断界限值W(可通过查表求得),按表上行写明的显著性水平a舍弃正态性假设;若W>W,接受正态性假设。 正态分布是许多检验的廉础'比如F检验,1•检验,卡方检验等在 总体不是正太分布是没有任何意义。悶此,对一个样本是否来门正态总体的检验是至关虛要的。为然,我们无法证明某个数据的确来自正态总体,但如果使 用效率高的检验还无法否认总体是正太的检验,我门就没有理山否认那些和正太分布有关的检验有意义,卜面我就对正苦性检验方法进行简单的归纳利比较。 一. 图示法 LP-P 图 以样本的累计频率作为横坐标,以按照JF态分布计算的相应累计概率作为纵坐标』以样本值表现为直角坐标系的散点。如果数拯服从正态分布,则样本点应围绕第一象限的对角线分布, 2.Q-Q 图 以样本的分位数作为横坐标,以按愿正态分布计算的相应分位点作为纵坐标、把样本表现为宜角坐标系的散点。如果数拥服从正太分布,则样本点应鬧绕第一象限的对角线分布円 以上两种方法以Q-Q图为佳,效率较高。 3.直方图 判断方袪:是否以钟型分布,同时可以选择输出正态性曲线& 4.箱线图 判断方法:观察矩形位置和中位数,若矩形位于中间位置且中位数位于矩形的中间位置,则分布较为对称,否则是偏态分布。 5.茎叶图 判断方法:观察图形的分布状态,是否是对称分布. 二. 偏度、竦度检验法: L S,K的极限分布 样本偏度系数s=£ (时 该系数用于检验对称性,30时,分布呈正偏态,S<0时,分布呈 负偏态° 样本峰度系数牟-3 (即 该系数用于检验峰态,K>0时为尖峰分布,S<0时为扁平分布;当S二0, K二0时分布呈正态分布。 H D:F(X)服从正态分布H l; F⑴不服从正态分布 当原假设为真时,检验统计最 扁沁9K -^=-N(O T1) J24 / n 对于给定的OC Z島Z島网其中心丐 2.Jarque-Bera检验(偏度和峰度的联合分布检验法)检验统计量为JB=二罟[◎+扌秽]~才(2) JB过大或过小时,拒绝原假设。 三. 非参数检验方法 L Kolmogorov-Smirnov正态性检验(靠于经验分布函数(ECDF)的检验} D = mK\F n(x)-F0(x)\ E(x)表示一组随机样本的累计概率函数,吒(力表示分布的分布函数。 当原假设为真时,D的價应较小,杵过大,则怀疑原假设,从而, 拒绝域为R = {D>d} 对于给定的口p=P{D>ci}=a>4} 2.Lilliefor正态性检验 该检验是对Ko 1 mo^orov-Sinirnov检验的修正,参数未知时,山fi = X^= W可计算得检验统计量0的值。 3.Shapiro-Wilk (W 检验) 检验统计忻: w= 热-可欲(厂可 当原假设为真时,W的值应接近于1,若值过小,则怀腿原假 込从而拒绝域为R = ^ 在给定的茨水平下P {职£厲二欢 4.才拟合优度检验(也是翠于经验分布函数(ECDF)的检验) 检验统计最为 说一1) r是被估参数的个数 若原假设为真时,F应较小,否则就怀疑廉假设,从血拒绝域为 R = >d},对于给定的u 尸用工叭又p = I f{/2 四•方法的比较 L图示法相对于其他方法而言,比较直观,方法简单,从图中可以直 接判断,无需计算,但这种方法效率不是很髙,它所捉供的佶息只是正态性检验的重要补充。 2.经常使用的才拟合优度检验和Kolmogorov-Sm让nov检验的检验功效较低,在许多计算机软件的Kolmogarov-Smirnov检验无论是大小样本都用大样本近似的公式,很不粘准,一般使用Shapiro-Wilk检验利Lil lief or 检验。 3.Ku 1 tuogorov-Srnirnov检验只能检验是否一个样本来门于一个已知样本,[fijLillielor检验可以检验是否来口未知总体。 4.Shapiro-ffilk检验和L订liefor检验都是进行大小排序启得到的,所以易受异常值的影响。 5.Shapiro-Wilk检验只适用于小样本场合(3 检验功效一般随样本容虽的增大而增大。 6.才拟件优度检验和Kolmogorov - Smirnov检验都采用实际频数和 期望频数进疔检验,前者既可用于连续总体,乂町用于离散总体,而 Ko 1 mogurov-Smirnov检验只适用于连续和定駅数据口 7.於拟合优度检验的检验结果依赖于分组,而艮他方法的检验结果 与区间划分无关。 &偏度和峰度检验易受异常值的影响,检验功效就会降低。 9.假设检验的口的是拒绝原假设,当p值不杲很大时,应根抓数拯背