经典非参数假设检验方法全

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在本节我们将介绍几种最常用的非参数检验方法: 符号检验、秩和检验和游程检验。
非参数检验
• 非参数检验的方法有很多种,如下几种检验: • 正态慨率纸检验; • 皮尔逊(Pearson)χ2拟合检验; • 柯尔莫哥洛夫与斯米尔诺夫检验; • Shapiro-Wilk W检验; • D’Agostion’s D检验; • Wilcoxon秩和检验。 • 符号检验 • 秩和检验 • 游程检验。
现在的问题是:上面的数据能否证实X 具有泊松分布的假设 是正确的?
又如,某钟表厂对生产的钟进行精确性检查,抽取100 个钟作试验,拨准后隔24小时以后进行检查,将每个钟的 误差(快或慢)按秒记录下来.
问该厂生产的钟的误差是否服从正态分布?
再如,某工厂制造一批骰子,声称 它是均匀的.
也就是说,在投掷中,出现1点,2 点,…,6点的概率都应是1/6.
为什么用非参数方法?
• 非参数检验同样也有其缺点。由于它对总体的 分布没有严格的要求,因此在检验过程中会失 去许多有用的信息,在方法上就缺乏针对性。 而且非参数检验是通过处理样本数据的秩或等 级来检验假设的,而不是利用原始数据,这又 会失去一些信息,因而检验的有效性有时会比 较差。
• 当然,如果我们事先对总体的分布信息一无所 知或难下定论,那么建立在数据本身基础上的 非参数检验结果要比建立在一个可疑的总体分 布基础上得到的参数检验结果要可靠的多。
• 在一定的假设下,这些秩和它们的统计量的分布 是可以求出来的,而且和原来的总体分布无关。 这样就可以进行所需要的统计推断了。这就是本 节所讲的非参数假设检验的基本思想。
为什么用非参数方法?
• 根据样本又分成
单样本检验
• 非参数检验
两独立样本检验 多个独立样本检验 多个相关样本检验 列联表某一变量各水平比例检验
为什么用非参数方法?
• 但是在总体分布形式已知时,非参数检验 就不如传统方法效率高。这是因为非参数 方法利用的信息要少些。往往在传统方法 可以拒绝零假设的情况,非参数检验无法 拒绝。
• 但非参数统计在总体未知时效率要比传统 方法要高,有时要高很多。是否用非参数 统计方法,要根据对总体分布的了解程度 来确定。
非参数假设检验
在前面的课程中,我们已经了解了假设检验的基本思 想,并讨论了当总体分布为正态时,关于其中未知参数的 假设检验问题 .
然而可能遇到这样的情形,总体服从何种理论分布并 不知道,要求我们直接对总体分布形式提出种种假设,然 后利用样本信息对假设进行检验。
在统计学中把不依赖于分布形式的统计方法称为非参数 统计。对总体的分布形式的检验就是非参数检验。
为检验骰子是否均匀,要把骰子实地投掷若干次,统 计各点出现的频率与1/6的差距. 问题是:得到的数据能否说明“骰子均匀”的假设是可信的?
解决这类问题的工具是英国统计学家K.皮尔逊在1900年
发表的一篇文章中引进的所谓 2检验法.
这是一项很重要的工作,不少人把它视 为近代统计学的开端.
2检验法是在总体X 的分布未知时,
• 二者的不同之处在于:参数检验需要对总体分 布作限制性的假定。这种假定实际就是要求总 体的分布类型已知,所不知道的只是其中的某 个参数,如均值或方差。而非参数检验并不要 求已知总体的分布信息,而是根据数据本身来 推断总体参数。
为什么用非参数方法?
• 在实际生活中,总体的分布信息并不是容 易得到的。有时,数据并不是来自所假定 的总体;或者,数据根本不是来自同一个 总体;还有可能,数据因为种种原因被严 重“污染”。这样,在假定总体分布的情 况下进行推断的做法就可能产生错误的或 者甚至灾难性的结论。
• 如检验正态分布的均值是否相等或等于零 等等。最常见的检验是和正态总体有关的 t-检验、F-检验、X2检验和最大似然比检
验等。
wenku.baidu.com
为什么用非参数方法?
• 非参数检验是针对参数检验而言的。从检验步 骤上讲,二者是一致的:它们都是对总体的某 种数量特征建立相应的原假设和备择假设,都 是在给定的显著性水平下,根据实际统计量来 判断对原假设的取舍。
• 于是,人们希望在不假定总体分布的情况 下,尽量从数据本身来获得所需要的信息, 这就是非参数统计的宗旨。
为什么用非参数方法?
• 正是由于非参数检验要求的信息少,检验 条件比较宽松,因此它具有很强的适应性, 应用的范围比起参数检验更宽广。非参数 检验不仅可以应用于定距、定比数据的检 验而且也适用于定类、定序数据的假设检 验。对于那些不能直接进行加减乘除四则 运算的数据,运用符号检验、秩和检验都 能起到比较好的效果。
例如,从1500到1931年的432年间,每年爆发战争的 次数可以看作一个随机变量,椐统计,这432年间共爆发 了299次战争,具体数据如下:
战争次数X 发生 X次战争的年数
0
223
1
142
2
48
3
15
4
4
在概率论中,大家对泊松分布产生的一般条件已有所了
解,容易想到,每年爆发战争的次数,可以用一个泊松随机 变量来近似描述 . 也就是说,我们可以假设每年爆发战争次 数分布X近似泊松分布.
非参数假设检验方法
一、2拟合优度检验
二、柯尔莫哥洛夫 三、斯米尔诺夫检验 四、独立性检验
一、2拟合优度检验
为什么用非参数方法?
• 那么,如何在不知道总体分布的情况下利用数据 本身的信息来进行假设检验呢?
• 我们知道,一组数据最基本的信息就是次序。我 们把样本中各个数据按从小到大的顺序排列起来, 则每个数据都会在这个顺序数列中有它的位置或 次序,这个位置或次序就叫做秩。数据有多少个 观察值,就有多少个秩。
根据来自总体的样本,检验关于总体分布 的假设的一种检验方法
K.皮尔逊
本章只介绍2拟合优度检验、柯尔莫哥洛夫以及
斯米尔诺夫检验、独立性检验方法。
除此还有:符号检验、游程检验、秩和检验等等。
为什么用非参数方法?
• 经典统计的多数检验都假定了总体的背景 分布。
• 在那里,总体的分布形式或分布族往往是 给定的或者是假定了的。所不知道的仅仅 是一些参数得知或它们的范围。于是,人 们的主要任务就是对一些参数,比如均值 和方差(或标准差)进行估计或检验。
相关文档
最新文档