【2019年整理】2单样本非参数检验
参数检验和非参数检验

参数检验和非参数检验参数检验和非参数检验是统计学中两种常用的假设检验方法。
参数检验假设总体服从其中一种特定的概率分布,而非参数检验则不对总体的概率分布进行特定的假设。
本文将分析和比较这两种假设检验方法,并讨论它们的优缺点和适用范围。
参数检验的基本思想是假设总体的概率分布属于一些已知的参数化分布族,例如正态分布或泊松分布。
然后根据样本数据计算出统计量的观察值,并基于它们进行假设检验。
常见的参数检验方法有t检验、F检验和卡方检验等。
以t检验为例,它适用于研究两个样本均值之间是否存在显著差异的情况。
假设我们有两组样本数据,分别服从正态分布。
可以使用t检验来计算两组样本均值的差异是否显著。
t检验基于样本均值和标准差来估计总体均值的差异,并通过计算t值和查表或计算p值来判断差异是否显著。
参数检验的优点是它们对总体概率分布的假设比较明确,计算方法相对简单,适用于数据符合特定分布的情况。
此外,参数检验通常具有较好的效率和统计性质。
然而,参数检验也有一些限制和缺点。
首先,参数检验通常对数据的分布假设要求较高,如果数据不符合指定的分布假设,则结果可能不可靠。
另外,参数检验对样本大小的要求较高,需要较大的样本才能获得可靠的检验结果。
此外,参数检验对异常值和离群值比较敏感,这可能会导致统计结论的错误。
与参数检验相比,非参数检验更加灵活,不需要对总体的概率分布做出特定的假设。
它适用于更广泛的数据类型和样本分布。
常见的非参数检验方法有Wilcoxon符号秩检验、Mann-Whitney U检验和Kruskal-Wallis检验等。
以Wilcoxon符号秩检验为例,它适用于比较两个相关样本的差异。
这个检验不要求样本数据满足正态分布的假设,它基于样本差值的秩次来判断差异是否显著。
非参数检验的优点在于其适用范围广泛,不需要对总体分布做出特定假设,对数据平均性和对称性的要求较低,对异常值和离群值的鲁棒性较好。
此外,非参数检验对样本大小的要求较低,可以在较小的样本情况下获得可靠的结果。
非参数检验方法

⾮参数检验⽅法⾮参数检验的推断⽅法不涉及样本所属总体的分布形式,也不会使⽤均值、⽅差等统计量,⾮参数检验是通过研究样本数据的顺序和分布的性质来构成理论基础,下⾯介绍⼀些⾮参数检验经常使⽤的样本数据信息:1.顺序:将样本数据按照升序排列,可以得到X1≤X2≤X3≤Xi....≤Xn,其中Xi为第i个顺序量。
2.秩将样本数据按照升序排列,可以得到X1≤X2≤X3≤Xi....≤Xn,Ri为Xi在这⼀列数据中的位置,称为秩,R1,R2,R3...Rn为样本数据的秩统计量3.结如果样本数据中存在相同的值,那么在排序时就会出现秩相同的情况,这样的情况称为结,结的取值是对应的秩的均值。
注意是秩的均值⽽不是数据本⾝的均值。
⾮参数检验的统计理论都是根据上述概念计算⽽来,此外,和参数检验⼀样,当我们得到分析数据的时候,最先做的⼯作还是先通过图表和⼀些描述性统计量对数据整体进⾏探索性分析,掌握数据⼤致分布情况、有⽆极端值等,为后续正确选择分析⽅法打下基础。
================================================ ====⾮参数检验主要应⽤在以下场合:1.不满⾜参数检验的条件,且⽆适当的变换⽅法进⾏变换2.分布类型⽆法获知的⼩样本数据3.⼀端或两端存在不确定值,如>10004.有序分类变量求各等级之间的强度差别更进⼀步来讲,⾮参数检验可以做以下分析:⼀、单样本总体分布检验⼆、两独⽴样本差异性检验三、两配对样本差异性检验四、多个独⽴样本差异性检验五、多个相关样本差异性检验可以看出,以上应⽤除了第⼀点之外,其他都有对应的参数检验⽅法,这就要根据样本数据的实际情况来进⾏选择了:适合使⽤参数检验的优先使⽤参数检验,否则使⽤⾮参数检验。
================================================ =下⾯我们分别介绍⼀下上述应⽤对应的⾮参数检验⽅法⼀、单样本总体分布检验单样本总体分布检验主要⽤来检验某样本所在总体分布和某⼀理论分布是否存在显著差异,主要涉及的⾮参数检验⽅法有:1.卡⽅检验卡⽅检验可以检验样本数据是否符合某⼀期望分布或理论分布,这在卡⽅检验中有所介绍,在此不再多说2.⼆项分布检验⼆项分布检验主要⽤来检验样本数据是否符合某个指定的⼆项分布,该检验只适合⼆分类变量样本。
单样本非参数检验

这个例子经过简单计算,得到样本均值为96.45,而 样本中位数为91;它们都可作为总体的中心的估计,除 此之外,众数(频率最大的点,本例是88)可作为中间位 置.在本例中,总体分布是未知的,为此从看该数据的 直方图中很难说这是什么分布。
66 75 78 80 81 81 82 83 83 83 83 84 85 85 86 86 86 86 87 87 88 88 88 88 88 89 89 89 89 90 90 91 91 91 91 92 93 93 96 96 96 97 99 100 101 102 103 103 104 104 104 105 106 109 109 110 110 110 111 113 115 116 117 118 155 192
第二章 单样本非参数检验
第一节 符号检验 第二节中位数的置信区间 第三节 Wilcoxon符号秩检验
第一节 符号检验
平均数mean(包括切尾平均数)中位数median 和众数 mode 都可用来表示数据的中心位置,参数数据分析中总 体的中心位置常用均值表示,例如当总体服从正态分布
时,使用 t 检验方法检验均值。而非参数数据分析方法中,
分析:中位数是这个问题中所关心的一个位置参数。 若产品长度真正的中位数大于或小于10米,则生产过 程需要调整。故做双侧检验,建立假设
H 0 : M 10; H1 : M 10
为了对假设作出判定,先要得到检验统计量S +或 S— 。将调查得到数据分别与10比较,算出各个符号的 数目: s + =1, s— =7,n=8。
p 2P(S 1n 8, p 0.5) 0.0704
p大于显著性水平0.05。表明调查数据支持原假设。即 生产过程不需要调整。
2单样本非参数检验

X (1) X (2) X (n)
假设顺序统计量X (i) X ( j) ,由X (i) , X ( j) 构成区间 X(i), X(j) 作为中位数的置信区间。
由于大于和小于中位数M的样本点数服从B(N,0.5)
1 p X (i) M X ( j)
分析:中位数是这个问题中所关心的一个位置参数。 若产品长度真正的中位数大于或小于10米,则生产过 程需要调整。故做双侧检验,建立假设
H 0 : M 10; H1 : M 10
为了对假设作出判定,先要得到检验统计量S
或
+
S— 。将调查得到数据分别与10比较,算出各个符号的
数目: s + =1, s— =7,n=8。
j
Cnk
k i
1 2
k
1 2
nk
Байду номын сангаас
j
第二章 单样本非参数检验
第一节 符号检验 第二节中位数的置信区间 第三节 Wilcoxon符号秩检验
第一节 符号检验
平均数mean(包括切尾平均数)中位数median 和众数 mode 都可用来表示数据的中心位置,参数数据分析中总 体的中心位置常用均值表示,例如当总体服从正态分布
时,使用 t 检验方法检验均值。而非参数数据分析方法中,
66 75 78 80 81 81 82 83 83 83 83 84 85 85 86 86 86 86 87 87 88 88 88 88 88 89 89 89 89 90 90 91 91 91 91 92 93 93 96 96 96 97 99 100 101 102 103 103 104 104 104 105 106 109 109 110 110 110 111 113 115 116 117 118 155 192
非参数统计_第五章 两独立样本(修正版)(1)

1
2
1
5
2
1
0
0
5
4
1
4
2
3
1
双样本检验举例1
解(1)建立 假设: H 0 : 培训对服务质量没有影响 H1 : 培训对服务质量产生影响 (2)计算检验统计量 D 0.5.
(3) n m 8, 给定显著性水平 0.05, 否定域为 D | D 0.625. (4)接受零假设,即培训对服务质量没有影响。
Z
Wx ( N 1)n / 2 ~ N (0,1) mn( N 1) /12
Mann-Whitney U 检验举例1
例 5.1 为了检验两个小组工人的生产效率是否具有显著性差异,从 两个组中随机抽取20个工人,其每日生产量和组别如下表。 表 5-1 两组工人生产量
产量 标记 产量 标记 产量 标记 产量 标记
习题
作业:某社会系的两名大学生随机地从该校三年级的学生中
抽取了若干名,询问他们每周看多长时间的电视, 记录如下:
男生
女生
10 14 11 3 10 5 7 12 40 19 6 8 15 11 8 25 10 7 6 7 5 25 30 6 5 42 7 4 38 15 6 4 1 15 22
试问男生和女生看电视的时间分布是否相同(α=0.05)
Wx 135 .5, W y 74 .5,
Wxy Wx 1 n(n 1) 80.5, 2
1 Wyx Wy m(m 1) 19.5, 2
U min(Wxy , W yx ) 19 .5
Mann-Whitney U 检验举例1
(3) n m 10, 给定显著性水平 0.05, 可查得U统计量的下界为 28. (4) U=19.5<28, 拒绝零假设,即两组工人的 生产效率存在显著差异.
非参数检验

非参数检验的优点:
①适用范围广,不论样本来自的 总体分布形式如何,都可适用;
②某些非参数检验方法计算简便, 研究者在急需获得初步统计结果时可 采用;
的总体分布不同。 α=0.05
2.混合编秩
依据两组数值由小到大编秩,结果 见上表。
3.求秩和并确定检验统计量T
把两组秩次分别相加求出两组的秩 和值,R1=315.5,R2=149.5。因乳 酸钙组样本含量较小,故 T=R2=149.5。
4.确定P值和作出推断结论 以较小样本含量为n1,n1=14, n2n1=2,查附表6,两样本比较秩和检验 用T界值表(双侧)。
当n1>20或(n2-n1)>10时,附表6 中查不到P值,则可采用正态近似法求u 值来确定P值,其公式如下:
u T n1(N 1) / 2 0.5 n1n2(N 1) 12
上式中T为检验统计量值,n1、n2 分别为两样本含量,N=n1+n2,0.5这 连续性校正数。上式为无相同秩次时使 用或作为相同秩次较少时的近似值。当 两样本相同秩次较多(超过总样本数的 25%)时,应按下式进行校正,u经校 正后可略增大,P值则相应减小。
式中,Ri为各组的秩和,ni为各组 样本含量,N为总样本含量。
当各组相同秩次较多时,可对H值进 行校正,按下式求值。
Hc H c
C 1
(t
3 j
t
j
)
(N3 N)
4.确定P值和作出推断结论
当组数K=3,每组样本含量ni≤5时, 可查附表7(H界值表)得到P值。若 k>3或ni>5时,H值的分布近似于自 由度为k-1的χ2分布,此时可查附表 4χ2界值表得到P值。最后按P值作出 推断结论。
非参数统计二单样本检验

第四节 Cox-Stuart趋势检验
检验原理:
数据序列: X1,X2,,…双,Xn边假设检验问题:
H 0 : 数 据 序 列 无 趋 势 H 1 : 有 增 长 或 减 少 趋 势
令:
c(nn+1/)2/,2,n为 n为 偶奇 数数
取数对(x i , x,ic ) Di x,i 为xi正c 的S数 目, 为负的数S 目 , 当正号
问:经费有无上升趋势?
首先用全部19个数据检验: n=19,c=10,S_=5,S+=4
再用1970年至1984年的15个数据检验: n=15,c=8,S_=7,S+=0
第五节 游程检验
游程的概念:
随机游程问题: 一个二元0/1序列当中,一段全由0或者全由1 构成的串成为一个游程,游程中数据的个数称 为游程长度,序列中游程的个数记为R,反映0 和1轮换交替的频繁程度。在序列长度N固定 的时候,如果游程过少过者过多,都说明序列 的随机性不好。当游程过多或者过少时,就会 怀疑序列的随机性。
位数不唯一,研究对称中心比中位数更有意义。 例:下面的数据中,O是对称中心吗?
0
检验步骤
Ex.某公司为减少加工费用,决定若铸件重量的中位数超过 25公斤,就转包加工;若不超过25公斤则不转包。现从这 批铸件中随机抽取8件,每件的重量分别为:24.3,25.8, 25.4,24.8,25.2,25.1,25.0,25.5。使用这些数据,能 否作出这批铸件是否转包的决定。
第二章 单样本检验
t X
s/ n
假设某地的10栋房屋出售价格(由低到高排列)为56,69, 85,87,90,94,96,113,118,179(单位:万元), 问该地区的平均房屋价格是否和人们相信的84万元的水平大 体一致。
非参数检验

两相关样本-符号秩次检验 (Wilcoxon)
符号秩次检验
• 威尔科克逊(F.Wilcoxon)提出了既考虑 差数符号,又考虑差数大小的符号秩次检 验法(signed-rank test)。
符号秩次检验
当样本容量 n > 25时,可用正态分布近似处理。 检验统计量为(在计算时,把相等的n去除。 在下例中有2对的秩相同,所以n为10)
多个独立样本的非参数检验
• 对于几个独立样本差异的显著性,可以用克鲁 斯卡尔(W. H. Kruskal)和沃利斯(W. A. Wallis)所提出的单向秩次方差分析进行检验。
• 这种方法又称为H检验法。它相对对多组平均 数所进行的参数的方差分析。
• 它不需要对样本所属的几个总体做正态分布及 方差齐性的假定。它处理的是秩次变量的资料。
• 秩和检验:指的是等级之和。
男生成绩:56, 62, 42,72, 76 女生成绩:68, 50, 84, 78, 46, 92
秩和检验
• 首先由维尔克松(wilcoxon)提出。后来 当比较两个独立样本的差异(两组样本不 相等)时,可以采用曼-惠特尼(MannWhitney)两人提出的秩和检验方法。又称 曼-惠特尼U检验法(Mann-Whitney U-test)。
秩和检验
• 小样本的情况
–两个样本的容量都小于或等于20时,检验 统计量为
U 1n1n2n1(n2 11)T1
U 2n 1 n 2n 2(n 2 2 1 ) T 2n 1 n 2 U 1
– 取U1和U2中较小者作为检验统计量,即令 U = min(U1, U2)
秩和检验
• 在大样本情况下,即两个样本之中至少有 一个容量大于20,则检验统计量U近似地服 从正态分布:
非参数统计讲义二单样本模型通用课件

02
单样本模型介绍
单样本模型定义
单样本模型是指仅使 用一个样本数据来构 建统计模型的统计方 法。
单样本模型常用于分 析单个样本数据的分 布、参数估计和假设 检验等。
它与双样本模型相对 ,后者需要两个独立 样本数据进行比较。
单样本模型的特点
简单易用
灵活性
单样本模型仅需一个样本数据,无需 复杂的配对或分组操作,计算过程相 对简单。
秩和检验的应用步骤
将数据排序,计算秩次,根据秩次计算统计量,与临界值进行比较。
秩和检验的优点
不受数据分布形式的限制,能够处理异常值和离群点。
案例三:直方图在单样本模型中的应用
直方图
直方图是一种非参数统计方法, 用于展示数据的分布情况。在单 样本模型中,直方图可以用于分
析一组数据的分布特征。
直方图的应用步骤
成本,对于大规模数据集可能存在计算效率问题。
02
对数据量和样本代表性要求较高
非参数统计方法需要足够的数据量和样本代表性,才能保证分析结果的
稳定性和可靠性。
03
对数据质量要求较高
非参数统计方法对数据的质量和完整性要求较高,如果数据存在缺失、
异常或偏差等问题,可能会影响分析结果的准确性和可靠性。
04
非参数统计在单样 本模型中的具体应 用
核密度估计在单样本模型中的应用
核密度估计是一种非参数统计方法,用 于估计未知概率密度函数。在单样本模 型中,核密度估计可以用来检验数据是 否符合特定的概率分布,或者比较两组
数据的分布是否相似。
核密度估计的基本思想是利用核函数和 权重函数对概率密度函数进行加权平均 ,从而得到未知概率密度函数的估计。 常用的核函数包括高斯核、多项式核等
两独立样本非参数检验-精选文档

SPSS提供了4种两独立样本的非参数检验方法。
Evaluation only. ted with Aspose.Slides for .NET 3.5 Client Profile 5.2 Copyright 2019-2019 Aspose Pty Ltd.
1.两独立样本的Mann-Whitney U检验
Mann-Whitney U检验(Wilcoxon秩和检验)主 要通过对平均秩的研究来实现推断。
秩:将数据按照升序进行排序,每一个具体数 Evaluation only. ted据都会有一个在整个数据中的名次或排序序号, with Aspose.Slides for .NET 3.5 Client Profile 5.2 这个名次就是该数据的秩。 Copyright 2019-2019 Aspose Pty Ltd. 相同观察值(即相同秩,ties),取平均秩。 两独立样本的Mann-Whitney U检验的零假设 H0:两个样本来自的独立总体均值没有显著差 异。
10.5 两独立样本非参数检验 10.5.1 统计学上的定义和计算公式
定义:两独立样本的非参数检验是在对总 体分布不很了解的情况下,通过分析样本数据, Evaluation only. ted 推断样本来自的两个独立总体分布是否存在显 with Aspose.Slides for .NET 3.5 Client Profile 5.2 著差异。一般用来对两个独立样本的均数、中 Copyright 2019-2019 Aspose Pty Ltd. 位数、离散趋势、偏度等进行差异比较检验。
将两组样本(X1 X2 …… Xm)(Y1 Y2 …… Yn) 混合升序排序,每个数据将得到一个对应的秩。 计算两组样本数据的秩和 x ,W y 。 EvaluationWonly. Wx+Wy= N(N+1)/2 ted N=m+n with Aspose.Slides for .NET 3.5 Client Profile 5.2 Copyright 2019-2019 Aspose Pty 如果 H0成立,即两组分布位置相同, WxLtd. 应接近 理论秩和 m(N+1)/2; Wy应接近理论秩和 n(N+1)/2)。 如果相差较大,超出了预定的界值,则可认为 H0不成立。
第3讲单样本非参数检验2二项分布检验

解答过程: (1)建立零假设和备选假设
H 0 :业绩好的新员工服从P值为0.6的二项分布
H 1 :业绩好的新员工不服从P值为0.6的二项分布
解答过程: (2)构造和计算统计量
k =28,p=0.6,n=32,k=28>(n/2)=16,计算统计量
Z k 0.5 np np(1 p) 28 0.5 32 0.6 32 0.6 (1 0.6) 2.995
4.3 二项分布检验的软件实现 (1)输入数据,方法1:原始数据法,如下:
• 输入数据方法2:频数法
注意:频数数据要加权
4.3 二项分布检验的软件实现 (2)按照Analyze菜单→Nonparametric Tests→Binomial
顺序选中二项分布检验计算模块,如图所示
弹出对话框:
待检验 变量 变量分类 方法 检验的P值
二项分布定义
★任意一次实验中,只有事件A(如正面)发生和不发生 两种结果,发生的概率分别为P和1-P. ★若在相同条件下,进行N次独立重复试验,用X表示这 N次试验中事件A发生的次数(k=0,1,2…),那么X服从二 项分布,记作X~B(N,P),也叫Bernolli分布。
P( X k ) C P (1 P)
k N k
N k
P=
二项分布检 验是做什么 的呢? 0.8 ? 0.7
二项分布检验就是通过样本数据检验总体是 否服从指定概率P值的二项分布。 二项分布检验的过程:
(1)建立零假设和备择假设
H0
:样本来自的总体服从指定P值的二项分布 :样本来自的总体不服从指定P值的二项分布
H1
(2)构造统计量
★当 n 20 时,可以构造统计量(德莫弗-拉普拉斯定理)
非参数统计讲义三--两样本检验

Mood Scores for Variable x Classified by Variable g Sum of Expected Std Dev g N Scores Under H0 Under H0 ----------------------------------------------------------------1 19 2789.83333 2406.66667 355.433586 2 20 2150.16667 2533.33333 355.433586 Average scores were used for ties. Mood Two-Sample Test Statistic 2789.8333 Z 1.0780 One-Sided Pr > Z 0.1405 Two-Sided Pr > |Z| 0.2810 Mood One-Way Analysis Chi-Square 1.1621 DF 1 Pr > Chi-Square 0.2810 Mean Score 146.833333 107.508333
( )( ) k tk P(A k) ,k m mn ( ) t
当A值太大时,考虑拒绝零假设。
HYPGEOMDIST(a,m,a+b,m+n)
例:全国30个省人均GDP,中位数4690,检验 沿海省X与非沿海省Y的中位数是否有差异?
观测值大于ME 观测值大于ME 总和
X样本 A=11 1 M=12
T 0.1702 W
所以应接受 H 0 .
两样本位置和尺度检验
假设样本: (X1, X2, … ,Xn)~i.i.d.F1
(Y1, Y2, … ,Yn)~i.i.d.F2
第2章 单个总体的非参数检验

第二章 单样本非参数检验在有了一个样本n X X ,,1 之后,很自然地想要知道它所代表的总体的“中心”在哪里.例如,在对人们的收入进行了抽样之后,就自然要涉及“人均收入”和“中间收入”等概念.这就与统计中的对总体的均值(mean),中位数(median)和众数(mode)等位置参数的推断有关。
例如,在知道总体是正态分布时,要检验其均值是否为μ;一个传统的基于正态理论的典型方法是t 检验.它的检验统计量定义为ns X t /μ-=这里X 为样本均值,而211)(X X n S -∑-=为样本标准差。
t —检验的统计量在零假设下有n —1个自由度的t —分布。
检验统计量是用样本标准差s 代替了有标准正态分布的检验统计量的总体标准差后而产生的在大样本时,二者几乎相等。
t —检验也许是世界上用得最广泛的检验之一。
但是,t —检验并不稳健,在不知总体分布时,特别是小样本时,应用t —检验就可能有风险。
这时就要考虑使用非参数方法。
对于本章所要介绍的数据趋势或随机性检验,就不存在简单的参数方法.非参数方法总是简单实用的。
本章所介绍的一些检验有代表性,因此这里的讨论将比其它章节更为仔细.一旦熟悉了非参数方法的一些基本思路,后面的内容就很容易理解了.第一节 符号检验和中位数的置信区间一、符号检验(SING TEST )符号检验(SING TEST )是利用正号和负号的数目某假设做出判定的非参数方法。
符号检验虽然是最简单的非参数检验,但它体现了非参数统计的一些基本思路.首先看一个例子。
联合国人员在世界上66个大城市的生活花费指数(以纽约市1996年12月为100)按自小至大的次序排列如下(这里北京的指数为99):66 75 78 80 81 81 82 83 83 83 83 84 85 85 86 86 86 86 87 87 88 88 88 88 88 89 89 89 89 90 90 91 91 91 91 92 93 93 96 96 96 97 99 100101 102 103 103 104 104 104 105 106 109 109110 110 110 111 113 115 116 117 118 155 192 这个总体的中间水平是多少?北京使在该水平之上还是之下?(北京为99)可以假定这个样本是从世界许多大城市中随机抽样而得的所有大城市的指数组成总体.可能出现的问题是:这个总体的平均(或者中间)水平是多少?北京是在该水平之上还是之下?这里的平均(或中间)水平是一个位置参数。
两个独立样本的非参数检验

两个独立样本的非参数检验两个独立样本的费参数检验正是对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布是否存在显著差异的方法。
曼-惠特尼U检验(Mann—whitney U)两个独立的曼-惠特尼U检验可用于对两个总体分布的比较判断。
其零假设是两组独立样本来自的总体分布无显著差异。
曼-惠特尼U检验通过对两组样本平均秩的研究来实现推断秩简单的说就是变量值排序的名次。
两个独立样本的K-S检验K-S检验不仅能够检验单个总体的分布是否与某一理论分布差异显著,还能够检验两个总体的分布是否存在显著差异,其零假设是两组独立样本来自的两个总体的分布无显著差异。
两个独立样本K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路大体一致。
主要差别在于:这里是以变量值的秩作为分析对象,而非变量值本身。
其基本思路如下:①首先,将这两组样本混合并按升序排序。
②然后分别计算两组样本秩的累计频数和累计频率。
③最后,计算累计频率之差,得到秩的差值序列并得到D统计量(同单样本K-S检验,但无需修正)。
两独立样本的游程检验单样本游程检验用来检验变量值的出现是否随机,而两个独立变量游程检验则用来检验两个独立样本来自的两个总体的分布是否存在显著差异。
其零假设是两组独立样本来自的两个总体的分布无显著差异。
两独立样本的游程检验与单样本游程检验的基本思想相同,不同的是计算游程数的方法。
两独立样本的游程检验中,又程数依赖于变量的秩。
步骤如下:首先,将两组样本混合并按升序排列,在变量值排序的同时,对应的组标记值也会随之重新排列。
然后,对组标记只序列按前面讨论的游程的方法计算游程数容易理解:如果两总体的分布存在较大的差距,那么游程数会相对比较少,如果游程数比较大,则应是两组样本充分混合的结果,那么总体的分布不会存在显著差异。
再次,根据游程数据计算Z统计量,该统计量近似服从正态分布。
极端反应检验极端反应检验从另一个角度检验两独立样本所来自的两个总体分布是否存在显著差异。
第3章 两样本的非参数检验

3.1.2 应用
学生编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
A卷成绩
70
75
70
80
70
70
70
76
75
71
75
75
75
82
75
86
75
70
78
80
76
80
75
75
79
80
72
83
75
83
B卷成绩
这些资料能否说明参考资料能够促进学生掌握知识 0.05
解:()提出假设 1 H 0 : P( xi yi ) P ( xi yi ) H 1 : P ( xi yi ) P ( xi yi ) 这里xi为第一次测试的成绩,yi为第二次测试的成绩。 (2)计算检验统计量 S 2, S 10, n 2 10 12, min( S , S ) 2 (3)确定拒绝域 1 2 i a.计算p.P( K k ) P( S 2) 12 c12 2 i 0 1 (1 12 66) 0.019287 4096 ( Excel计算“=BINOMDIST(2,12,0.5,TRUE)” ) p , 数据不支持H 0, 可以认为参考资料能够促进学生掌握知识。 b.查表,查n 12, 0.05得界域(3, 9),所以拒绝H 0,可以认为参 考资料有用。
H 0 : 两种材料对产品使用寿 命没有显著影响( i的中位数 0) D
(2)计算检验统计量
T 19 14 1 2.5 10 11 15 12 2.5 16 18 17 138 T 6.5 9 8 6.5 5 4 13 52 T min(T , T ) (138,52) 52 (3)做出决策 根据n 19, T 52,由Wilcoxon符号秩和检验指导表 及大样本近似可得: 2P(W w) 2 ( T n(n 1) / 4 0.5 )=2 (-1.71)=0.088> 0.05 n(n 1)(2n 1) / 24
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一般情况,备择假设采用我们觉得有道理的方向。上面的 例题采用左侧检验,备择检验:M<99。因为只有一点为99, 舍去这一点,于是从66减少到65。而s+=23在零假设下(下 面概率p=0.5),二项分布的概率
B(23,65,0.5) C6253 (0.5)23 (1 0.5)6523
就是该检验的p值。P(S+ <23)=0.0124。 也就是说,在零假设下,目前由该样本所代表的事件的
H 0 : M 99; H1 : M 99 H 0 : M பைடு நூலகம்99; H1 : M 99
(s+ =23)
S+ (s+ =23)
P( S+ <23)=0.0124
2P( S+ <23)=0.0248
拒绝零假设
拒绝零假设
结论
中位数小于99
中位数不等于99
[例] 生产过程是否需要调整。 某企业生产一种钢管,规定长度的中位数是l0米。现 随机地:从正在生产的生产线上选取10根进行测量, 结果: 9.8 10.1 9.7 9.9 9.8 10.0 9.7 10.0 9.9 9.8
令
S+=得正符号的数目 S—=得负符号得数目
可以知道S +或S— 均服从二项分布B(66,0.5)。 则S+和S—可以用来作检验的统计量. 左侧检验H0 : M 99; H1 : M 99,当零假设为真的时, S+应该 不大不小。当S+过小,即只有少数的观测值大于99,则认定 中位数99可能太大,实际总体的中位数可能要小一些。对于
分析:中位数是这个问题中所关心的一个位置参数。 若产品长度真正的中位数大于或小于10米,则生产过 程需要调整。故做双侧检验,建立假设
H 0 : M 10; H1 : M 10
为了对假设作出判定,先要得到检验统计量S +或 S— 。将调查得到数据分别与10比较,算出各个符号的 数目: s + =1, s— =7,n=8。
66 75 78 80 81 81 82 83 83 83 83 84 85 85 86 86 86 86 87 87 88 88 88 88 88 89 89 89 89 90 90 91 91 91 91 92 93 93 96 96 96 97 99 100 101 102 103 103 104 104 104 105 106 109 109 110 110 110 111 113 115 116 117 118 155 192
右侧检验H0 : M 99; H1 : M 99 ,当零假设为真的时, S+应 该不大不小。当S+过大,即有多数的观测值大于99,则认定 中位数99可能太小,目前实际总体的中位数可能要大一些。
双侧检验 H0 : M 99; H1 : M 99 对备择假设H1来说关心的是 等于正的次数是否与等于负的次数有差异。
这个总体的中间水平是多少?北京市在该水平之上 还是之下?(北京为99)
这个例子经过简单计算,得到样本均值为96.45,而 样本中位数为91;它们都可作为总体的中心的估计,除 此之外,众数(频率最大的点,本例是88)可作为中间位 置.在本例中,总体分布是未知的,为此从看该数据的 直方图中很难说这是什么分布。
j
Cnk
k i
1 2
k
1 2
nk
j
Cnk
k i
1 2
n
由于得到的区域是以中位数位对称的,故
1 p X (k1) M X (nk)
第二章 单样本非参数检验
第一节 符号检验 第二节中位数的置信区间 第三节 Wilcoxon符号秩检验
第一节 符号检验
平均数mean(包括切尾平均数)中位数median 和众数 mode 都可用来表示数据的中心位置,参数数据分析中总 体的中心位置常用均值表示,例如当总体服从正态分布
时,使用 t 检验方法检验均值。而非参数数据分析方法中,
发生的概率仅为0.0124,所以不大可能。也就是说,北
京的生活指数(99)不可能小于世界大城市的中间水准.
对于双边假设检验,为计算方便,一般取S+和 S—中较小的一个做检验统计量;如用K表示,则 K=min(S+,S—)。在本例子中,若是双边检验,P 值应该二倍于单侧检验的。
检验统计量 P-值 检验的结果
定义2.1把n个样本点按从小达到的顺序排列,得
X (1) X (2) X (n)
假设顺序统计量X (i) X ( j) ,由X (i) , X ( j) 构成区间 X(i), X(j) 作为中位数的置信区间。
由于大于和小于中位数M的样本点数服从B(N,0.5)
1 p X (i) M X ( j)
p 2P(S 1n 8, p 0.5) 0.0704
p大于显著性水平0.05。表明调查数据支持原假设。即 生产过程不需要调整。
第二节 基于符号检验的中位数置信区间
例 我国国有经济15个行业的1996年职工平均工资按从 小到大的次序为(单位:元)
4038 4940 5798 6161 6344 6610 6695 6709 6967 6992 7897 7987 8546 8679 8701 求中位数的置信区间。
总体的中心位置常用总体的中位数表示,故关于中心位 置的检验问题就是关于中位数的检验问题。
符号检验(SING TEST)是利用正号和负号的数目对
某种假设做出判定的非参数方法。
符号检验虽然是最简单的非参数检验,但它体现 了非参数统计的一些基本思路.首先看一个例子。
例1联合国人员在世界上66个大城市的生活花费指数 (以纽约市1996年12月为100)按自小至大的次序排 列如下(这里北京的指数为99):
30
20
10
Std. Dev = 18.09
Mean = 96.5
0
N = 66.00
70.0
90.0
110.0
130.0
150.0
170.0
190.0
80.0
100.0
120.0
140.0
160.0
180.0
VAR00001
假定用总体中位数M来表示中间位置,就意味着样 本点 X1,取,大X 于n M的概率应该与取小于M的概率相 等。所研究的问题可以看作是只有两种可能“成功” 或“失败”。成功为“+”, 即大于中位数M;失败 为“-”,即小于中位数M。