第九讲和第十讲 统计1107班 王凤娇 翻译
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
STA333第九讲
检验配对数据:Wilcoxon符号-秩检验
9.1 Wilcoxon符号-秩检验
我们回顾一下猴子数据:
►例:猴子的刺激。一位生理学家希望知道猴子更喜欢大脑区域A的刺激还是大脑区域B的刺激。
在该实验中,14只猴子被教导要按下两个按钮。当灯亮起时,压在按钮1总是导致区域A的刺激;压在按钮2总是导致区域B的刺激。学习按按钮后,猴子再测试15分钟,在这段时间内记录压两个按钮的频率。频率越高,喜欢这种刺激的程度越高。
数据显示在下面。每只猴子被测试两次,因此这是一个成对数据的例子。该数据的形式是(X,Y)对。
我们已经在上一讲中做了这些数据的符号检验。
符号检验一个明显的问题是它丢弃了很多关于数据的信息。它考虑到了差异的方向,但不是每对数之间的差的大小。
99页
在这一点上,我将讨论另一种方法,使用配对样本比较两个群体。这种新的方法称为Wilcoxon符号-秩检验,它不是一个基于二项分布的检验,所以我们将不得不考虑有点不同的东西。
试验的性质
假设在一个区间尺度上,我们有n对测量值(X1,Y1),(X2,Y2),...,(X n,Y n)的随机样本。区间尺度测量是考虑测量值之间的距离有意义的一种测量。令D i= X i- Y i,每对的不同分数(就像在符号检验)。
假设。要试验的假设与在第8讲的符号检验是相同的,即我们是在比较两个群体真实的中位数M x和M y :
H0 :M x = M y 与H a :M x ≠M y (双侧检验)
M x > M y (上尾检验)
M x < M y (下尾检验)与往常一样,基于相关研究的问题,你选择的合适的备择假设H a。
检验统计量的推导。让我们用相同猴子的刺激的数据来说明符号检验。14组得分差(D i ′s)分别为:
–20,–7,–14,–13,–26,+5,–17,–9,–10,–9,–7,+3,+2,–17 首先,删除其中D i=0的所有观测值。剩下的这些观测值,我们基于绝对值(即:不考虑符号)的基础对这些D i的值进行排序,然后给每个观测值分配秩。结果如下:
D i +2 +3 +5 -7 -7 -9 -9 -10 -13 -14 -17 -17 -20 -26
秩 1 2 3 4.5 4.5 6.5 6.5 8 9 10 11.5 11.5 13 14
秩为1的与最小的值(绝对值)对应,秩为2的与下一个大的对应,以此类推。如果两个值的的得分差相同,我们通常将秩平均后对应这些观测值。关于这个更多的请看下一节。
本例中,V=6(即:1+2+3)。
100页
►课堂练习:工作周5天与4天的里程比较。灵活地安排时间能减少资源的需求?湖县伊利诺伊州卫生局对灵活的四天工作周做了试验。该部门记录了一年中一个普通的每周5天工作制的7个工人的里程。然后它变成一个灵活的4天工作制,再记录一年的行驶里程。这项研究的目的是确定是否里程小而导致了4天日程安排。
计算Wilcoxon符号-秩统计量V。
那么,现在我们要弄清楚如何得到p值。要做到这一点,首先要了解V在不同情况下的行为:
●如果原假设H0:M x = M y是真实的,正秩总和与负秩总和将大致相等。在这种情况
下,V≌n(n+1)/4。
●如果(假设)H a :M x > M y是真实的,它将会导致看到很多的组都是X i > Y i ,因
此更多的组的D i >0。所以,较大的秩差将趋于正,最终我们将会看到V的值增
加了。
●同样的观点也可用于进行下尾检验和双边检验。
检验统计量V的原分布。(只是一个提醒:这不是二项分布)。V的抽样分布可以通过查看标记(+)和(-)的可能的排列来获得,然后计算每一个可能的排列的与标记(+)有关的秩和。如果原假设H0为真,那么每一个标记(+)和(-)的可能的排列很可能相等。
101页
►课堂练习。假设我们有n=4(X,Y)对不打结的秩,所以我们得到四个唯一的D i。发现V的完整的原假设分布:与正得分有关的秩和。
p值。根据定义,任何假设检验的p值是证明作为实际样本中观察到的样本至少违背H0(并接受H a)的可能性大小。在这种情况下,p值将是来自V的原假设分布的一些可能性。
我们将用R计算它。然后,我们可以在一些预先确定的显着性水平α下比较它。
假设。
1.样本是随机的。
2.样本是连续的。
3.差的分布是对称的。
102页
9.2问题,问题:处理打结和零
假设2基本上确保所有的观察值将是唯一的,即在任何地方都没有重复值。但是当然,人们四舍五入的值,使用独立尺度,等等。这就是真实的世界。因此,如果连续性的假设是错误的,是否存在D i 为零的值,或者绝对值D i 打结?
另外还有两种方式,违反连续性假设会影响结果:
●蒙混的零。我们所谓的在符号检验的情况下的零点蒙混(因为它是相当虚假的)使
在符号-秩检验的情况下更有意义。在Wilcoxon符号-秩检验中,D i= X i -Y i为零的
值,差异应该得到尽可能小的绝对值,因为零的绝对值小于任何其他数字。我们不
妨给他们零秩,从零开始计数,而不是一。他们对秩和的统计量V没有什么贡献。
●打结的秩。前面问题的处理情况,其中单个值给了一对完全相同的值。但第二类错
误导致一个不同的问题:如果我们有两个单个值D i 打结?(看看猴子数据:这种
情况是相当普遍存在的。)
在这种情况下赋予秩并不是问题:如前所述,习惯上,以下列方式处理打结的秩:将打结的秩平均后在赋予它们,如果不打结就不用了。
举例来说,如果你有两个打结的得分占据位置3和4,将它们的秩均记为3.5。将占据7,8,9位置的三个打结的得分对应的秩记为8。这是处理打结数据较好的方法,因为不论是否存在打结的得分,固定的得分数目的秩和将会是相同的。事实上,R 固有的功能可以完成这些:
> d <- c(12,43,43,19)
> rank(d)
[1] 1.0 3.5 3.5 2.0
然而,主要的问题是打结得分的出现会使V的原假设分布改变。因为这个,检验的p 值或许会改变。这有可能会改变测试的结果,慎重考虑很重要的!
►练习(你自己)。和以前一样,假设我们有n=4(X,Y)对数,但不同的是在第3和4位置的观测值之间有一个打结的数,因此对应的秩也就变成了1,2.5,2.5,4。找出这个例子中V的原假设分布,看看它的原假设分布与没有打结秩的例子的不同。
103页