基于秩次的非参数检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七章基于秩次的非参数检验

前言:

1. 问题的提出:

前面学习了连续型资料两组样本均数差异的假设检验方法:★小样本用t检验,条件是变量服从正态分布和方差齐。

★大样本用Z检验(中心极限定理)。

如果是小样本,变量的分布不清、已知不服从正态分布或经数学转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?

★需要一种不依赖于分布假定的检验方法,即非参数检验。

2. 基本概念:

前面介绍的检验方法首先假定变量服从特定的已知分布(如正态分布),然后对分布的参数(如均数)作检验。这类检验方法称为参数检验。

今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量分布的中心位置或分布形态作检验。这类检验称非参数检验,由于其对总体分布不作严格假定,所以又称任意分布检验。

(1)非参数检验的优点:a. 不受总体分布的限制,适用范围广。

b. 适宜定量模糊的变量和等级变量。

c. 方法简便易学。

(2)缺点:对于适合用参数检验的资料,如用非参数检验会造成信息的丢失,犯第Ⅱ类错误的概率增大,造成检验功效下降。

(3)基于秩次的非参数检验(秩和检验)的基本思想:

例:假设有一组观察值为1.1, 1.3, 1.7, 4.3, 11.4 。

显然这一变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。

如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。

对秩和分布的中心位置(平均秩和)作检验,这就是秩和检验。

一.配对样本的符号秩检验(Wilcoxon signed rank test):

例7.1:研究出生先后的孪生兄弟智力是否存在差异?

表7.3 12对孪生兄弟智力测试结果

对子号兄的得分弟的得分兄弟得分差秩次

1 86 88

2 3

2 71 77 6 7

3 77 76 -1 -1.5

4 68 64 -4 -4

5 91 9

6 5 5.5

6 72 72 0 -

7 77 65 -12 -10

8 91 90 -1 -1.5

9 70 65 -5 -5.5

10 71 80 9 9

11 88 81 -7 -8

12 87 72 -15 -11

差值一般在5左右,但个别较大,如15,可能不服从正态分布。而且样本较小,不能利用中心极限定理作正态假定。因此考虑使用非参数检验---符号秩检验。

1.符号秩检验的分布理论:假定有四对观察值,如果H 0成立时,这四个值有同等的概率取正值或负值,即每个值取正值的概率等于二分之一。四个值

共有24=16种组合,每种组合发生的可能性就是:0625016

121212121.p ==⨯⨯⨯=。再考虑秩和,可能的结果数减少到11种,概率分布见表7.1。

表7.1 n=4时所有可能秩和情况和T*的分布

正差数的秩次负差值

的秩次

正秩和

T+

负秩和

T-

概率

P

1,2,3,4 -- 10 0 0.0625 2,3,4 1 9 1 0.0625 1,3,4 2 8 2 0.0625 1,2,4 3 7 3 0.1250 3,4 1,2 7 3

1,2,3 4 6 4 0.1250 2,4 1,3 6 4

1,4 2,3 5 5 0.1250 2,3 1,4 5 5

1,3 2,4 4 6 0.1250

4 1,2,3 4 6

1,2 3,4 3 7 0.1250

3 1,2,

4 3 7

2 1,3,4 2 8 0.0625

1 2,3,4 1 9 0.0625

- 1,2,3,4 0 10 0.0625

如果零假设成立,观察的结果应该服从此分布,即出现极端的可能性很小。如果真是出现小概率,那么我们对零假设的真实性产生怀疑,拒绝零假设。

2.具体计算步骤:

(1)检验假设:

H0:差值的总体中位数为零。M d=0

H1:差值的总体中位数不等于零。M d≠0

α=0.05。

(2)编秩和计算秩和:求差值,差值的绝对值由小到大编秩,●差数为零不参加编秩,相同差值求平均秩。分别求正号和负号的秩和,取绝对值小的为T。

(3)确定概率,下结论:查附表10,在n=11时,T0.05=11。现T=24.5>11,故P>0.05,按α=0.05的水准,不拒绝H0。

(★T小,P小)。

3.正态近似:当研究例数较大时(n>50),秩和T的分布近似正态分布,可以用正态分布理论作假设检验:

这时正态分布的均数和标准差分别等于:

24

/)12)(1(4/)1(++=+=n n n n n T T σμ 检验的公式为: 24

/)12)(1(5.0|4/)1(|5.0||++-+-=--=n n n n n T T Z T T σμ

二.两独立样本的秩和检验(Wilcoxon rank sum test):

表7.5 缺氧条件下猫与兔的生存时间(分)比较

n 1=5 T 1=78.5 n 2=14 T 2=111.5

这是生存时间资料,一般不服从正态分布,个别寿命长的为特大值,样本也较小,需考虑用非参数检验---秩和检验。

1.具体计算步骤:

(1)检验假设:H0:两总体生存时间的中位数相等;

H1:两总体生存时间的中位数不等;α=0.05。

(2)编秩和计算秩和:两组由小到大混合编秩,有相同值求平均秩(同组相同值可不求平均秩),求例数较少组的秩和(T)。

( 数值为零应编秩。)

(3)确定概率,下结论:T值在表中两数值之间时,p值大于相应界值,T位于区间之外,P<相应界值。

本例T= T1=78.5,查附表11,T =78.5>78,P<0.01,拒绝H0,可认为猫、兔在缺氧的条件下生存时间不等。

2.正态近似:当样本较大时,秩和的分布近似正态分布,可以用正态分布理论作假设检验。这时正态分布的均数和标准差分别等于:

相关文档
最新文档