3---_Wilcoxon符号秩检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0
成立,有
Xi X j 2
0 , i j}.
特别当原假设为H0:θ =0成立,有
W #{

Xi X j 2
0, i j}.

Hodge-Lehmann估计量 利用Walsh平均可以得到对称中心θ 的点估计,
即可由Walsh平均的中位数来估计对称中心,称之为 Hodge-Lehmann估计量。
100( 1-α )%置信区间为 [ W (k+1), W (N-k)]。

再看看例2.2的置信区间。 求出其Walsh平均,共55个值。取α=0.05, 则求得k=9时,有 P(W+ ≤ 9)≤0.025,P (W+≥ 55-9)≤0.025,
所以θ 的95%的置信区间为 [ W (10), W (46)]=[ 8.02, 12.73 ]。
样本 xi
zi的 符号






3.92 6

4.32 7



6.45 10
zi的绝 3.88 2.19 0.37 1.74 2.39 对值 秩 5 3 1 2 4
4.89 5.54 8 9

Step 2. 计算W+。 W+=2+4+6+7+8+9+10=46 利用W+的分布,辅以统计软件,可计算出 p值= 0.032。 Step 3. 所以给定α=0.05时,此时可拒绝原 假设,认为欧洲人均酒精年消费多于8升。
两配对数据比较问题

两成对数据的比较问题可以转化成单样本 问题,用符号检验或Wilcoxon符号秩检验做 统计分析。方法是将两成对样本作差,观 察它们的差值,将其视为新的样本,所以 两配对样本实际上就是单一样本。

例 2.3 给12组双胞胎做心理检验,以测量每个人 的进取心。我们感兴趣的是对双胞胎进行比较, 看第一个出生的是否倾向于比另外一个更有进取 心。结果如下,高分显示更多的进取心。表中, Xi表示第一个出生的得分,Yi表示第二个出生的得 分。D i表示两者差,即D i = Yi -Xi, i=1, 2, … , 12。 Ri表示D i绝对值的秩。则D1,…,D12是独立同分 布的,且设总体为D 。
80
+ 9 9
81
- 7 7
72
- 15 12

Di的12个值按顺序排列为: -15, -12, -10, -8, -7, -4, -3, -1, 2, 5, 6 , 9 取α=0.05,查表可得k=14。则MD的95%的置信区 间为[ W (15), W (64)]。

这15个最小的平均,由(-15-15)/2开始,是 -15, -13.5, -12.5, -12, -11.5, -11, -11, -10, -10, -9.5, -9.5 ,-9, -9, -8.5, -8 所以, W (15)=-8,即置信区间下界是-8。
n
注: S是W+当Ri=i时的特殊情况。研究W+ 的分布可转为研究S的分布。
概率分布 性质 2.2 在总体的分布关于原点0对称时, W+的概率分布为 P ( W+ = d )=P ( S=d ) =t n(d)/2n, 其中,d=0, 1, 2, … , n(n+1)/2,tn (d)表示从1, 2, … , n这n个数中任取若干个数(包括一个都 不取),其和恰为d,共有多少种取法。

检验步骤: H0: θ =θ
0
(对应于各单双边备择假设)
Step 1. 计算 xi 0 , i=1, 2, … , n。记差为z i. Step 2. 将差z i.的绝对值,即 z1 , … , z n 按从小到 大的顺序排列。由于总体服从连续型分布,不妨 假定样本互不相等,都不等于0,且样本差的绝对 值也互不相等。所以可得到样本z i.的绝对值的秩, 不妨记 的秩为R i。 zi
问题是求D的中位数MD的95%置信区间。
Leabharlann Baidu
双胞胎组
1
2
3
4
5
6
7
8
9
10
11
12
Xi
86
71
77
68
91
72 77
91
70
71
88
87
Yi
Di符号 |Di| Ri
88
+ 2 2
77
+ 6 6
76
- 1 1
64
- 4 4
96
+ 5 5
62 65
- 10 10 - 12 11
88
- 3 3
62
- 8 8


对称性 性质 2.3 在总体的分布关于原点0对称时, W+服从对称分布,对称中心为n(n+1)/4, 即:对所有的d=0, 1, 2, … , n(n+1)/4,有 P ( W+ = n(n+1)/4 - d ) = P ( W+ = n(n+1)/4 + d ),
P ( W+ ≤ n(n+1)/4 - d ) = P ( W+ ≥ n(n+1)/4 + d )。
Wilcoxon符号秩检验置信区间

Walsh平均 为利用更多的信息,可求每两个数的平均 ( Xi+Xj )/2, i≤ j,(一共有 n(n+1)/2 个)来扩 大样本数目。这样的平均称为Walsh平均。

Walsh平均和W+的关系。 在原假设成立的条件下,即 H0:θ =θ
W ( 0 ) #{

先计算每个样本值和原假设中me0的值 之差,即Xi-8。
考虑这些差的绝对值并将绝对值从小到 大排序,从而求出这些绝对值的秩。 再计算比8大的样本对应的绝对值的秩之 和,如果这个和比较大,我们就拒绝原假 设,接受备择假设。



问题一般提法: 假定样本X1, … , X n来自分布连续对称 的总体X,在此假定下总体X的中位数等于 均值。 问题主要是检验中位数,即原检验为 H0:me=me0,相对于各种单双边的备择假 设。

例 2. 2中我们的检验设为: H0:M=8 ,H1:M > 8
下面来用Wilcoxon符号秩检验,等价于检验 H0:θ =8 ,H1: θ > 8

检验步骤 Step 1. 对于 i=1, 2, … , n,计算得到新的样本zi和 它们对应的秩如下:
4.12 5.18 7.63 9.74 10.39 11.92 12.32 12.9 13.54 14.45

15个最大的平均,从(9+9)/2开始,是 9, 7.5, 7, 6, 5.5, 5.5, 5, 4, 4, 3.5, 2.5, 2, 2, 1.5 ,1 所以, W (64)=1,置信区间的上界是1。

所以中位数95%的置信区间是[ -8, 1 ]。

W+的分布性质
设独立同分布样本x1,…,xn来自连续对称总体 X,X分布的对称中心为θ 。为方便讨论,不妨设原假 设为 H0:θ =0, 即总体分布关于原点0对称的条件下,讨论W+ 的性质。 注:W+与W-有下列关系: W++ W- = n(n+1)/2

(关键)性质 2.1 令 S i 1 iui , 则在总体的 分布关于原点0对称时,W+与S同分布。
ˆ median{ X i X j , i j}. 2

θ
0
的置信区间。
可利用Walsh平均得到θ 0 的100( 1-α )%置信
区间。具体步骤: (1) 先求出满足下面两式的整数k,即k使得 P(W+≤k)≤α/2,P (W+≥ n-k)≤α/2,
(2) 将求出的Walsh平均数,按升幂排列,记为 W(1), … , W(N),N=n(n+1)/2,则θ 0 的
Step 3. 符号秩和检验统计量为
W i 1 ui Ri , 其中
n
1, zi 0 ui 0, 否则。
或者取检验统计量为
W i 1 vi Ri , 其中
- n
1, zi 0; vi 0, 否则。
主要取W+为检验统计量。

Step 4 设w+表示由样本算出的W+的值。 (1) H0: θ =θ 0 , H1: θ >θ 0 p值=P( W+≥ w+ ); (2) H0: θ =θ 0 , H1: θ <θ 0 p值=P( W+≤ w+ ); (3) H0: θ =θ 0 , H1: θ ≠θ 0 p值=2min{P( W+≥ w+ ),P(W+≤ w+)}
结果完全对称!说明符号检验只与符号有关!

Wilcoxon符号秩检验结果 对于检验(H1): 检验统计量W+=46 , p值=0.03223,对α=0.05,拒绝H0。 对于检验(H2): 检验统计量W+=11, p值=0.05273,对α=0.05,不能拒绝H0。
结果不对称!说明Wilcoxon符号秩检验不仅与符号 有关,还和数值大小有关!

有结的情况下,用平均秩法。 性质2.6 在总体的分布关于原点0对称,有结秩取 平均时, E(W+)=n(n+1)/4, g +)=n(n+1)(2n+1)/24- ( i3 i ) / 48 D(W i1 其中g表示结的个数, i 表示第i个结的长度。 有结时,W+的期望和方差实际上是条件期望和 方差,它们是在样本数据中给定有g个结,且结的长 度分别给定为 1 , 2 ,, g 时的条件期望和条件方差。
对Step 4的注解: 对于对称中心不为0的总体分布,可以转 化为中心为0的情况进行检验! 现不妨假设θ0=0,则原假设变为 H0:θ=0 对于这种检验,通过严格的证明来说明p值 的选取。
(1)H0: θ=0 , H1: θ>0。 若H1成立,则总体X的分布关于点θ对称。 从而有, P( X>0 ) > P( X<0 ) , 且对任意正数a, P( X>a ) > P( X<-a )。 所以当H1成立,不仅观察到的取正值的样本 数据的个数比较多,且取正值的样本数据的 拒绝值也比较大。由此,H1成立时,W+的值 较大 。所以p值=P( W+≥ w+)。
§2.2 Wilcoxon符号秩检验
Wilcoxon符号秩检验 ( Wilcoxon signedrank test )是非参数统计中符号检验法的改进, 它不仅利用了观察值和原假设中心位置的 差的正负,还利用了差的值的大小的信息。 虽然是简单的非参数方法,但却体现了秩 的基本思想。

例 2. 4 下面是10个欧洲城镇每人每年平均消费的 酒量(相当于纯酒精数)(单位:升)。数据已 经按升幂排列。 4.12 5.18 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45 人们普遍认为欧洲各国人均年消费酒量的中 位数相当于纯酒精8升,也就是me0=8。由数据 算得的中位数为11.16。因此,我们的检验设为: H0:me=8 ,H1:me > 8

期望方差及渐近正态性 性质 2.4 在总体分布关于原点0对称时, E(W+)=n(n+1)/4, D(W+)=n(n+1)(2n+1)/24。 性质 2.5 若总体分布关于原点0对称,则在样本容 量n趋于无穷大时,W+有渐近正态性: W+ L N(n(n+1)/4,n(n+1)(2n+1)/24)
注: (1)与符号检验不同: Wilcoxon符号秩检验 假设总体分布是对称的。 (2)在总体分布对称的假设下,即设总体X 的分布关于点θ 对称,则X的均值和中位数 相同,且均为θ 。所以检验总体中位数可 等价于检验总体对称中心。即检验的原假 设 H0:M=M0 等价于 H0:θ=θ0(相对于各 种单双边的备择假设)。


与符号检验的比较。
续例 2.2 两个不同方向的假设检验。 考虑下面的假设检验: H0:M=12.5, H1:M<12.5 (H2) 比较它与前一个假设检验: H0:M=8, H1:M>8 (H1) 对这两个问题分别用Wilcoxon符号秩检验和符 号检验方法。

符号检验结果 对于检验(H1): S-=3, S+=7, 检验统计量K=S+=3, p值=0.171875,对α=0.05,不能拒绝H0。 对于检验(H2): S-=7, S+=3, 检验统计量K=S+=3, p值=0.171875,对α=0.05,不能拒绝H0。
相关文档
最新文档