统计学之非参数检验讲义

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 重于100g的只有8包。这样的二项分 布变量小于或等于8的概率为0.05388 。这就是p-值。
• 因此, 对于水平a=0.05, 根据这个符号 检验,没有充分的证据拒绝零假设。

数据gs.txt •SPSS输出的结果在下面表格中。从 该表格可以看出精确的双边检验的 p-值=0.108(精确地为0.1078);也 就是说,我们的单尾检验的p-值为 其一半。

SPSS软件使用
.2. 数据gs.sav有一列(变量名为m),这 是重复零假设的100g使得m的长度和 gsweight一样。然后利用选项Analyze- Nonparametric Tests-Related Samples,再 把变量gsweight和m同时选入Test Pair(s) List之中,再在下面选Sign及在Exact中 选Exact;然后回到主对话框,OK即可。 得出前面的第二个输出。
很明确。我们就其最广泛的意义 来理解。 • 在计算中,诸如列联表分析中的 许多问题都有精确方法,Monte Carlo抽样方法和用于大样本的 渐近方法等选择。精确方法比较 费时间,后两种要粗糙一些,但 要快些。

秩(rank)
• 非参数检验中秩是最常使用的概 念。什么是一个数据的秩呢?一 般来说,秩就是该数据按照升幂 排列之后,每个观测值的位置。 例如我们有下面数据
• 在总体分布形式已知时,非参数检验不 如传统方法效率高。这是因为非参数方 法利用的信息要少些。往往在传统方法 可以拒绝零假设的情况,非参数检验无 法拒绝。
• 但非参数统计在总体未知时效率要比传 统方法要高,有时要高很多。是否用非 参数统计方法,要根据对总体分布的了 解程度来确定。

• 这里介绍一些非参数检验。 • 关于非参数方法的确切定义并不

16.2 单样本检验
16.2.2单样本位置参数的Wilcoxon符号秩检验
• 符号检验只用了差的符号,但没 有利用差值的大小。
• Wilcoxon 符号秩检验(Wilcoxon signed-rank test) 把差的绝对值 的秩分别按照不同的符号相加作 为其检验统计量。
• 它利用了更多的信息。

16.2 单样本检验
16.2.1单样本中位数(a-分位数)符号检验
• 我们知道某点为中位数(a-分位数)意 味着一个数小于该点的概率应该为 0.5(a).
• 因此,一个观测值小于该点(或与 该点之差的符号为负号)的概率为 0.5(a)。
• 这就是符号检验名称的来源,并与 二项分布有关。

例:数据gs.txt
•X •1 •9 •1 •3 •1 •8 •5 •1 •7 •1
•Ri •57 •5 •89 •1 •78 •4 •2 •36 •3 •91
i
0
•这下面一行(记为Ri)就是上面一
行数据Xi的秩。

秩(rank)
•利用秩的大小进行推断就避免 了不知道背景分布的困难。这 也是非参数检验的优点。
•多数非参数检验明显地或隐含 地利用了秩的性质;但也有一 些非参数方法没有涉及秩的性 质。

16.1 关于非参数的一些常识 • 无需假定总体分布的具体形式,
仅仅依赖于数据观测值的相对大 小(秩)或零假设下等可能的概率 等和数据本身的具体总体分布无 关的性质进行的检验都称为非参 数检验(nonparametric testing)。

• 这些非参数检验在总体分布未知时有很 大的优越性。它总是比传统检验安全。
• 例16.1 质量监督部门对商店里面出售的某厂家 的西洋参片进行了抽查。对于25包写明为净重 100g的西洋参片的称重结果为(单位:克):
•99.05 100.25 102.56 99.15 104.89 101.86 96.37 96.79 99.37
•96.90 93.94 92.97 108.28 96.86 93.94 98.27 98.36

数据gs.txt •另一种输出来自于SPSS的另一种选 项:

SPSS软件使用
• 这里有两种选项方式: • 1.以数据gs.sav为例。直接使用SPSS选项
Analyze-Nonparametric Tests-Binomial, 再把变量gsweight选入Test Variable List, 然后在下面Define Dichotomy的Cut point 输入100(克),在下面Test Proportion 输入p0=0.50(零假设大于100小时的比例 );还可以点击Exact来选择精确检验, 渐近检验和Monte Carlo方法等,然后OK 即可得到前面显示的结果。
•100.81
92.99 103.72 90.66 98.24 97.87 99.21 101.79

数据gs.txt • 样本中位数为m=98.36。因此,
人们怀疑厂家包装的西洋参片份 量不足。由于对于这些重量的总 体分布不清楚,决定对其进行符 号检验。需要检验的是:

数据gs.txt
• 按照零假设,每个观测值(每包西洋 参的净重)大于中位数m0=100g的机 会和小于100g的概率都是0.5。这服 从二项分布Bin(25,0.5)。

16.2 单样本检验
16.2.2单样本位置参数的Wilcoxon符号秩检验
• Wilcoxon符号秩检验需要一点总体 分布的性质;它要求假定样本点来 自连续对称总体分布;而符号检验 不需要知道任何总体分布的性质。
• 在对称分布中,总体中位数和总体 均值是相等的;因此,对于总体中 位数的检验,等价于对于总体均值 的检验。
统计学之非参数检验讲 义
2020年4月29日星期三
吴喜之
统计学
─从数据到结论

第十六章 非参数检验

16.1 关于非参数的一些常识
• 经典统计的多数检验都假定了总 体的背景分布。
• 但在总体未知时,如果假定的总 体和ຫໍສະໝຸດ Baidu实总体不符,那么就不适 宜用通常的检验
• 这时如果利用传统的假定分布已 知的检验,就会产生错误甚至灾 难。

• 假定x1,x2,…, xn为来自连续对称总体。 如果零检验为中位数(均值)m = m0。
• 把满足xi-m0<0的|xi-m0|的秩求和,并用 W-表示;同样把满足xi-m0>0的|xi-m0|的 秩求和,并用W+表示。如果m0的确是 中位数,那么,W-和W-应大体差不多。
相关文档
最新文档