正态性分析的方法总结
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
四、直方图
直方图,是一种二维统计图表,它的两个坐标分别是统 计样本和该样本对应的某个属性的度量。当直方图为钟 型分布时,则可判断其正态。
五、箱线图
箱形图又称为盒须图、盒式图或箱线图,是一种用作显 示一组数据分散情况资料的统计图。因型状如箱子而得 名。在各种领域也经常被使用,常见于品质管理。在箱 线图中,观察矩形位置和中位数,若矩形位于中间位置, 且中位数位于矩形的中间位置,则分布为正态或近似正 态,否则是偏态分布。
三、Q-Q图
Q-Q图是一种散点图,对应于正态分布的Q-Q图,就是由 标准正态分布的分位数为横坐标,样本值为纵坐标的散 点图。要利用QQ图鉴别样本数据是否近似于正态分布, 只需看QQ图上的点是否近似地在一条直线附近,而且该 直线的斜率为标准差,截距为均值。 用QQ图还可获得样 本偏度和峰度的粗略信息。
五、Anderson-Darling检验
是一种最小距离估计方式,也是估计偏离正态性的最有 效的统计量之一,对于样本量小于等于25很有效,大样 本可能被拒绝正态性,样本量大于等于200一般都会通过 Anderson-Darling检验.该检验对与偏态的尾部分布较敏 感。
六、CvM检验
该检验是判断样本经验分布 Z‘ 和给定的理论分布 Z 的拟合程度。
正态性分析的方法总结
图示法
一、累加次数曲线
累积频数曲线是指用曲线图形的方式表示出向上或向下 的累积频率的曲线图形。画好图后,比较正态分布概率 曲线和样本累加频率曲线重合程度,可判断样本分布是 否正态。
二、P-P图
P-P图是根据变量的累积比例与指定分布的累积比例之间 的关系所绘制的图形。通过P-P图可以检验数据是否符合 指定的分布。当数据符合指定分布时,P-P图中各点近似 呈一条直线。如果P-P图中各点不呈直线,但有一定规律, 可以对变量数据进行转换,使转换后的数据更接近指定 分布。因此,当指定分布为正态分布时,就可以使用P-P 图进行近似估略。
四、卡方拟合优度检验(也是基于经验分布 函数(ECDF)的检验)
用一个公式定量地表示总体的概率函数,即选一个分布来拟合这批数据所属的 总体,这就是英国统计学家 K.Pearson引入的著名的卡方拟合优度检验。
简单讲,卡方检验方法检验的是样本观察次数(或百分比)与理论或总体次数 (或百分比)的差异性。理论或总体的分布状况,用统计的期望值来表示。卡 方检验的统计原理,是比较观察值或理论值的差别,如果两者的差异越小,检 验结果越不容易达到显著水平,反正,则越可能达到显著水平,就可以下结论 拒绝虚无假设而接受备择假设。基本公式如下:
峰度系数g2
当g2=3时分布是对称的;g2>3是分布的峰度比正态分布 的峰度低阔;g2<3时,表面分布的峰度比正态分布的峰 度高狭。当N>1000时,g2值才比较可靠
假设检验方法
一、Kolmogorov-Smirno(KS)检验(基于经验分布函数(ECDF)的检验)
Kolmogorov-Smirnov检验法是检验单一样本是否来自某一特定分布。比如检 验一组数据是否为正态分布。它的检验方法是以样本数Kolmogorov-Smirnov 检验法是检验单一样本是否来自某一特定分布。比如检验一组数据是否为正 态分布。它的检验方法是以样本数。 即对于假设检验问题: H0:样本所来自的总体分布服从某特定分布; H1:样本所来自的总体分布不服从某特定分布。
六、茎叶图
茎叶图又称“枝叶图”,它的思路是将数组中的数按位 数进行比较,将数的大小基本不变或变化不大的位作为 一个主干(茎),将变化大的位的数作为分枝(叶), 列在主干的后面,这样就可以清楚地看到每个主干后面 的几个数,每个数具体是多少。可根据其对称性大致判 断正态,适用于小样本。
偏度、峰度检验法
二、Lilliefor正态性检验
该检验是对Kolmogorov-Smirnov检验的修正,当总体均值和方差未知时, Lilliefor提出用样本均值和标准差代替总体的期望和标准差,然后使用 Kolmogorov-Smirnov正态性检验法。
三、Shapiro-Wilk检验(W检验)
Shapiro—Wilk检验法是S.S.Shapiro与M.B.Wilk提出用 顺序统计量W来检验分布的正态性,对研究的对象总体, 先提出假设认为总体服从正态分布,再将样本量为n的样 本按大小顺序排列编秩,然后由确定的显著性水平α , 以及根据样本量为n时所对应的系数α i,根据特定公式计 算出检验统计量W。最后查特定的正态性W检验临界值表, 比较它们的大小,满足条件则接受假设,认为总体服从 正态分布,否则拒绝假设,认为总体不服从正态分布。
这种方法是根据分析分布的峰度系数与偏度系数,确定 分布形态。一般情况下,需要观测数据的数目要足够大, 应用这种方法才有意义。
一、偏度检验
判断偏度系数 g1=0时分布是对称的;g1>0时分布为偏正态;wk.baidu.com1<0时分 布呈负偏态。当观测值N>200时,这个偏态系数的统计量 g1才比较可靠。
二、峰度检验
直方图,是一种二维统计图表,它的两个坐标分别是统 计样本和该样本对应的某个属性的度量。当直方图为钟 型分布时,则可判断其正态。
五、箱线图
箱形图又称为盒须图、盒式图或箱线图,是一种用作显 示一组数据分散情况资料的统计图。因型状如箱子而得 名。在各种领域也经常被使用,常见于品质管理。在箱 线图中,观察矩形位置和中位数,若矩形位于中间位置, 且中位数位于矩形的中间位置,则分布为正态或近似正 态,否则是偏态分布。
三、Q-Q图
Q-Q图是一种散点图,对应于正态分布的Q-Q图,就是由 标准正态分布的分位数为横坐标,样本值为纵坐标的散 点图。要利用QQ图鉴别样本数据是否近似于正态分布, 只需看QQ图上的点是否近似地在一条直线附近,而且该 直线的斜率为标准差,截距为均值。 用QQ图还可获得样 本偏度和峰度的粗略信息。
五、Anderson-Darling检验
是一种最小距离估计方式,也是估计偏离正态性的最有 效的统计量之一,对于样本量小于等于25很有效,大样 本可能被拒绝正态性,样本量大于等于200一般都会通过 Anderson-Darling检验.该检验对与偏态的尾部分布较敏 感。
六、CvM检验
该检验是判断样本经验分布 Z‘ 和给定的理论分布 Z 的拟合程度。
正态性分析的方法总结
图示法
一、累加次数曲线
累积频数曲线是指用曲线图形的方式表示出向上或向下 的累积频率的曲线图形。画好图后,比较正态分布概率 曲线和样本累加频率曲线重合程度,可判断样本分布是 否正态。
二、P-P图
P-P图是根据变量的累积比例与指定分布的累积比例之间 的关系所绘制的图形。通过P-P图可以检验数据是否符合 指定的分布。当数据符合指定分布时,P-P图中各点近似 呈一条直线。如果P-P图中各点不呈直线,但有一定规律, 可以对变量数据进行转换,使转换后的数据更接近指定 分布。因此,当指定分布为正态分布时,就可以使用P-P 图进行近似估略。
四、卡方拟合优度检验(也是基于经验分布 函数(ECDF)的检验)
用一个公式定量地表示总体的概率函数,即选一个分布来拟合这批数据所属的 总体,这就是英国统计学家 K.Pearson引入的著名的卡方拟合优度检验。
简单讲,卡方检验方法检验的是样本观察次数(或百分比)与理论或总体次数 (或百分比)的差异性。理论或总体的分布状况,用统计的期望值来表示。卡 方检验的统计原理,是比较观察值或理论值的差别,如果两者的差异越小,检 验结果越不容易达到显著水平,反正,则越可能达到显著水平,就可以下结论 拒绝虚无假设而接受备择假设。基本公式如下:
峰度系数g2
当g2=3时分布是对称的;g2>3是分布的峰度比正态分布 的峰度低阔;g2<3时,表面分布的峰度比正态分布的峰 度高狭。当N>1000时,g2值才比较可靠
假设检验方法
一、Kolmogorov-Smirno(KS)检验(基于经验分布函数(ECDF)的检验)
Kolmogorov-Smirnov检验法是检验单一样本是否来自某一特定分布。比如检 验一组数据是否为正态分布。它的检验方法是以样本数Kolmogorov-Smirnov 检验法是检验单一样本是否来自某一特定分布。比如检验一组数据是否为正 态分布。它的检验方法是以样本数。 即对于假设检验问题: H0:样本所来自的总体分布服从某特定分布; H1:样本所来自的总体分布不服从某特定分布。
六、茎叶图
茎叶图又称“枝叶图”,它的思路是将数组中的数按位 数进行比较,将数的大小基本不变或变化不大的位作为 一个主干(茎),将变化大的位的数作为分枝(叶), 列在主干的后面,这样就可以清楚地看到每个主干后面 的几个数,每个数具体是多少。可根据其对称性大致判 断正态,适用于小样本。
偏度、峰度检验法
二、Lilliefor正态性检验
该检验是对Kolmogorov-Smirnov检验的修正,当总体均值和方差未知时, Lilliefor提出用样本均值和标准差代替总体的期望和标准差,然后使用 Kolmogorov-Smirnov正态性检验法。
三、Shapiro-Wilk检验(W检验)
Shapiro—Wilk检验法是S.S.Shapiro与M.B.Wilk提出用 顺序统计量W来检验分布的正态性,对研究的对象总体, 先提出假设认为总体服从正态分布,再将样本量为n的样 本按大小顺序排列编秩,然后由确定的显著性水平α , 以及根据样本量为n时所对应的系数α i,根据特定公式计 算出检验统计量W。最后查特定的正态性W检验临界值表, 比较它们的大小,满足条件则接受假设,认为总体服从 正态分布,否则拒绝假设,认为总体不服从正态分布。
这种方法是根据分析分布的峰度系数与偏度系数,确定 分布形态。一般情况下,需要观测数据的数目要足够大, 应用这种方法才有意义。
一、偏度检验
判断偏度系数 g1=0时分布是对称的;g1>0时分布为偏正态;wk.baidu.com1<0时分 布呈负偏态。当观测值N>200时,这个偏态系数的统计量 g1才比较可靠。
二、峰度检验