基于秩次的非参数检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于秩次的非参数检验

1. 问题的提出

前面学习了连续型资料两组样本均数差异的假设检验方法:

小样本用t检验,条件是变量服从正态分布和方差齐;大样本用标准正态分布的Z检验。

如果是小样本,变量的分布不清,或者已知不服从正态分布或经变量转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?

需要一种不依赖于分布假定的检验方法,即非参数检验。

2. 基本概念

前面介绍的检验方法首先假定分析变量服从特定的已知分布(如正态分布),然后对分布参数(如均数)作检验。

这类检验方法称参数检验(parametric test)。

今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量的中心位置或分布位置作比较。这类检验称非参数检验(nonparametric test),由于其对总体分布不作严格假定,所以又称任意分布检验。(distribution-free test)

非参数检验的优点:

a.不受总体分布的限制,适用范围广。

b.适宜定量模糊的变量和等级变量。

c.方法简便易学。

缺点:

如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布(如正态分布),这时人为地将精确测

量值变成顺序的秩,将丢失部分信息,造成检验功效能下降。基于秩次非参数检验(秩和检验)的基本思想

假设变量X有观察值1.1, 1.3, 1.7, 4.3, 11.4

显然这变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。但如果将变量作转换,变成秩变量

Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。然后对这秩分布的中心位置(中位数)作检验,这就是秩和检验。

7.1 配对样本的符号秩检验(Wilcoxon signed rank test)例7.1为研究出生先后的孪生兄弟间智力是否存在差异,12对孪生兄弟测试的结果见表7.3。

表7.3 12对孪生兄弟测试结果

T +=24.5,T -=41.5

符号秩检验的分布理论:假定有4个差值,如果H 0成立时,这4个差值有同等的概率取正值或负值,即每个值取正值的概率等于1/2。4个差值每种组合发生的可能性就是:

0625

.02

1

212121=⨯⨯⨯=P 。所有可能的秩和情况和T *

的分布见

表7.1。

表7.1 n=4时所有可能秩和情况和T*的分布

正差数的秩次负差值

的秩次

正秩和

T+

负秩和

T-

检验统计

量T*

概率

P

1,2,3,4 -- 10 0 0 0.0625 2,3,4 1 9 1 1 0.0625 1,3,4 2 8 2 2 0.0625 1,2,4 3 7 3 3 0.1250 3,4 1,2 7 3 3

1,2,3 4 6 4 4 0.1250 2,4 1,3 6 4 4

1,4 2,3 5 5 5 0.1250 2,3 1,4 5 5 5

1,3 2,4 4 6 4 0.1250 4 1,2,3 4 6 4

1,2 3,4 3 7 3 0.1250

3 1,2,

4 3 7 3

2 1,3,4 2 8 2 0.0625

1 2,3,4 1 9 1 0.0625

- 1,2,3,4 0 10 0 0.0625

如果零假设成立,观察的结果应该服从这分布,即出现极端的可能性很小。如果真是出现小概率,那么我们对零假设的真实性产生怀疑,拒绝零假设。

表 7.2 Wilcoxon符号秩检验的判断原则

双侧检验单侧检验(1) 单侧检验(2) 检验假设H0:Md(d)=0 H0:Md(d)=0 H0:Md(d)=0 H1:Md(d)≠0 H1:Md(d)>0 H1:Md(d)<0

统计决策:

小样本查表法若T*≤Tα/2(n),

则拒绝H0

若T-≤Tα(n),

则拒绝H0

若T+≤Tα(n),

则拒绝H0

大样本正态近似法 若│Z │>Z α/2 , 则拒绝H 0 若│Z │>Z α , 则拒绝H 0 若│Z │>Z α, 则拒绝H 0

当研究例数较大时(n>50),秩和T 的分布近似正态分布,可以用正态分布理论作假设检验。

这时正态分布的均数和标准差分别等于: μT =n(n +1)/4

24/)12)(1(++=n n n T σ 检验的公式为:

24/)12)(1(5

.04/)1(5

.0*

*

++-+-=

--=

n n n n n Z T T T

T σ

μ

具体计算步骤: a. 建立检验假设:

H0: 中位数为零; H1:中位数不等于零;α=0.05

b. 编秩、计算秩和:差数为零不参加编秩,相同差值求平均秩。分别求正号和负号的秩和,取绝对值小的为T。

c. 确定概率:查附表10,在n=11时,T0.05=11。现24.5>11,故p>0.05。

7.2 两独立样本的秩和检验(Wilcoxon rank sum test)

例7.2 在缺氧条件下,观察4只猫与12只兔的生存时间(分),结果见表7.5。试判断猫、兔在缺氧条件下生存时间的差异是否具有统计学意义。

这是生存时间资料,一般不服从正态分布,样本也较小,需考虑用非参数检验---秩和检验。

秩和检验的基本思想:两组观察值共有n例,设例数较少的组有n1例,按观察值大小顺序分别编秩为1,2,…,n。如

相关文档
最新文档