医学统计学精品教学第十章-非参数检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

32
采用Wilcoxon秩和检验
一、建立检验假设,确定检验水准
H0 :样本来自两个相同总体 (样本的每个观察值来自两总体的概率 均为0.5)
H1 :样本来自两个不同总体 (样本的每个观察值来自两总体的概率 不等)
α=0.05
2019/9/17
医学统计学-秩和检验
33
二、编秩
将两组数据由小到大统一编秩,如遇 相同原始数据,若在同一组,仍按数据 出现顺序编秩;若在不同组,则取其平 均秩次。本例编秩结果见表2
2019/9/17
秩和检验
13
例1:分别用氰化高铁法与光电比色法测 得10个血样的血红蛋白含量,问两法测 得结果有无差别?
2019/9/17
秩和检验
14
表1 两种方法测定血清血红蛋白含量
血样号 氰化高铁法 光电比色法
1
15.0
12.5
2
12.8
12.9
3
13.5
13.0
4
11.3
12.8
5
12.3
2019/9/17
秩和检验
23
2019/9/17
秩和检验
24
符号秩和检验的SPSS实现
1 定义变量
2019/9/17
秩和检验
25
符号秩和检验的SPSS实现
2
输 入 数 据
2019/9/17
秩和检验
26
2019/9/17
秩和检验
27
符号秩和检验的SPSS实现
2019/9/17
秩和检验
28
符号秩和检验的SPSS实现
不考虑研究对象总体分布的具体形式,也 不对总体参数进行统计推断,而是通过检验 样本所代表的总体分布形式是否一致来得出 统计结论。由于这类方法不受总体参数的限 制,故称非参数统计法。有时也称为任意分 布检验(distribution-free statistics)。
2019/9/17
秩和检验
4
3、非参数统计的优点
2019/9/17
秩和检验
34
表2 两种疗法的退热时间
新疗法
退热时间 秩号
25
1
30
2
32
3
35
4
37
6
39 7.5
39 7.5
42 10
46 12
48 13.5
n1=10 T1=66.5
两样本混 合后统一 编秩求得
秩号
分别求秩和
旧疗法 退热时间 秩号
36 5 40 9 44 11 48 13.5 50 15 56 16 59 17 60 18 64 19 195 20 240 21
37
在本例中,T=66.5,取α=0.05,根据附表9 双侧检验界值0.01区间为(73,147),T 位于区间外,所以P<0.01。
P<0.01,因此在α=0.05的水准上,拒绝H0 , 接受H1,认为新疗法与旧疗法的退热时间 不同。
2019/9/17
15.4
6
12.1
12.9
7
13.7
13.0
8
12.9
14.1
9
12.9
12.1
10
13.0
12.9
配对差值经检验不符合正态分布,不满足t检验条件
2019/9/17
医学统计学-秩和检验
15
符号秩和检验的基本步骤:
1. 建立检验假设,确定检验水准
2.
3.
同)
H0 :Md=0(两处理效应相同) H1 :Md≠0(两处理效应不相
F

S12(大) S22(小)
864.94816.2863 137.5929
F F0.05,(7,7) 4.99
P<0.05
两样本方差不齐,不能应用t检验
2019/9/17
医学统计学-秩和检验
31
采用Wilcoxon两独立样本秩和检验
基本思想:假定原假设H0成立(样本来自两 个相同总体),合并两样本,将观察值由
9
秩和检验
秩次(rank):就是将观察值按顺序由小 到大排列(排名次),并用序号(如1, 2, 3… )代替变量值本身,秩次即通常意 义上的序号。
秩和:即秩次的和。
秩转换:将数值变量转换成秩次,再计算 检验统计量的过程。
秩和检验:就是通过秩次的排列求秩和进 行假设检验的方法。
2019/9/17
秩和检验
n2=11 T2=164.5
2019/9/17
医学统计学-秩和检验
35
三、分组求秩和并确定检验统计量
当样本例数不等时,取较小例数组的秩和为 统计量T;如n1=n2,则取任一组秩和为统计 量T。本例中:
∵n1=10 < n2=11 ∴T=min(T1,T2)=T1=66.5
2019/9/17
医学统计学-秩和检验
⒉ 非参数检验的有些问题的计算仍显繁冗。
2019/9/ቤተ መጻሕፍቲ ባይዱ7
秩和检验
6
何时使用非参数检验?
1.等级资料(半定量资料)
2. 当指标只能用严重程度(轻、中、重),优 劣等级(好、中、差),治疗转归(治愈、好转、 无效)等形式表达时,原始资料并非定量的,这 些数据比“定量”粗,而比一般的“定性”细, 是相继的若干阶梯。但毗邻的阶梯之间并非等距 离,亦不能度量。
10
Contents
第一节 配对资料的符号秩和检验(Wilcoxon配对法) 第二节 两独立样本比较的秩和检验(Wilcoxon两样本
法) 第三节 完全随机设计多个样本比较的秩和检验
(Kruskal-Wallis检验)
2019/9/17
秩和检验
11
第一节 两配对样本差值的符号秩和检验 (Wilcoxon signed rank test)
u|Tn(n1)/4|0.5 (式10-1)
n(n1)(2n1)/24
秩和标准
式中0.5是连续性校正数,因差为T值是 不连续的,而u分布是连续的。
2019/9/17
秩和检验
21
当存在同一秩较多时,按(式10-1)计算
的u值要比实际的u值小,应采用(公式 10-2)对u加以校正:
u |Tn(n1)/4|0.5
2019/9/17
秩和检验
19
本例中:
T=23 对子数n=10,查p226附表8得 23∈[10 45] 故 P>0.10
下结论:在α =0.05水准上不拒绝H0 ,故 不能认为两法测得血红蛋白含量有差别。
2019/9/17
秩和检验
20
平均秩和
② 大样本时( 对子数n>50)通过公式进
行u转化,采用正态近似检验:
5. 如经变量变换达到方差齐性,则可用参数 检验;否则的话就要用非参数法处理。
2019/9/17
秩和检验
8
何时使用非参数检验?
5. 分布形态不明的资料
6.
小样本,但又不趋向于正态分布;
不稳定,例数少,分布不明确的资料。
符合参数检验条件→首选参数检验 不符合条件→非参数检验
2019/9/17
秩和检验
符号秩和检验由Wilcoxon于1945年提 出,作为配对t检验的替代方法。检验配 对资料的差值是否来自中位数为0的总体。
在数据满足配对t检验的要求时,符 号秩和检验的功效是配对t检验效能的 95%左右。
2019/9/17
秩和检验
12
符号秩和检验的基本思想:
在H0成立的条件下(两配对处理效应相 同 ),两配对样本的差数的正负是随 机的,则正差数的秩和与负差数的秩和 应该相差不会太大,即总体中位数为0; 反之,若两秩和相差太悬殊,则认为H0 成立的可能性受到怀疑,从而拒绝H0, 接受H1。
小到大排列,编写秩次。在H0成立的条件下, T值应接近平均秩和n0(1+N)/2,其中 N=n1+n2, n0=min(n1, n2)。 如果T值严重偏离平均秩和,则提示H0可能是 不正确的。
(1+2+3+… …+16)/2=68
n0(1+N)/2=8*(1+16)=68
2019/9/17
医学统计学-秩和检验
2019/9/17
1
第十章 非参数秩和检验
吴库生 汕头大学医学院预防医学教研室
参数统计与非参数统计
1、参数统计(parametric statistics) 样本所来自的总体分布具有某个已知
的函数形式(如正态分布),而其中有 的参数是未知的,统计分析的目的是对 这些未知的参数进行估计或检验。
2019/9/17
0.7 秩
8 12.9 14.1 -1.2
-7
9 12.9 12.1
0.8
10 13.0 12.9
0.1
T-= -32
正秩 (6) 9 3
4 5.5 1.5 T+=23
验算:|T 2019/9/17
+
|+|
T-|
=n(n+1)/2=55 医学统计学-秩和检验
统计量T
18
3. 分别求正、负差数的秩和,以绝对值较 小者为T
铁法 色法
(1) (2)
(3)
(4)=(2)-(3) (5)
1 15.0 12.5
2.5
2 3
12.8 12.9 13.5 13.0
-0.1 0.5
对差
-1.5
4
11.3 12.8
-1.5 数的 -8
5 12.3 15.4 -3.1 绝对 -10
6
12.1 12.9
-0.8 值编 -5.5
7 13.7 13.0
36
四、查p227附表9( n1,n2均较小 )确定检验 界值的区间,得到P值并做出推断结论
原则:找到n1和n2-n1对应的四行界值, 如果T位于检验界值区间内,P>α,不拒绝H0; 如果T值恰好等于界值,P≦α;如果T位于 检验界值区间外,P<α,拒绝H0 ,接受H1 。
2019/9/17
医学统计学-秩和检验
n(n1)(2n1)
24
(t3j tj) 48 校正系数
其中,tj是相同秩号的个数。
2019/9/17
秩和检验
22
符号秩和检验的SPSS实现
SPSS(Statistical Package for Social Science,社会科学统计软件包) 一直是国际上最流行且最具权威性的统 计分析软件之一。SPSS最显著的特点是 菜单和对话框操作方式,无需编程,且 图形功能强大,易于掌握和操作。
α=0.05
2019/9/17
秩和检验
16
2. 求两组数据的差数d,对差数的绝对值 编秩号
⑴ 差数为0的数据忽略不计,对子数减1; ⑵ 余下的n-i个差数按绝对值由小到大排 秩号,但排好后的秩号要保持原差数的正负 号; ⑶差数绝对值相等时,则取其平均秩次。
2019/9/17
秩和检验
17
表1 两种方法测定血清血红蛋白含量 血样号 氰化高 光电比 差值 负秩
秩和检验
2
但实际上有些医学研究资料并不符合上述
条件,即使用变量变换的方法也难以达 到应用参数方法的要求。
这就需要一种不依赖于总体分布的具体形 式的统计方法来解决此类问题。
由于这类方法不受总体参数的影响,故称
非参数检验法。它检验的是分布,而非 参数。
2019/9/17
秩和检验
3
2、非参数统计( non-parametric statistics )
2019/9/17
秩和检验
29
Wilcoxon Signed Ranks Test
结 果
2019/9/17
Ranks
N Mean RankSum of Ranks
光 电 比 色 法 -Negative Ranks
5a
氰 化 高 铁 法 Positive Ranks
5b
4.60 6.40
23.00 32.00
⒈ 适用范围广,不论样本所代表的总体分 布形式如何,甚至是未知的,都可适用;
⒉ 资料可用“等级”、“符号”表示,收 集方便;
⒊ 多数非参数检验方法简便,易于理解和 掌握。
2019/9/17
秩和检验
5
4、非参数统计的缺点
⒈ 对符合用参数检验的资料,如用非参数 统计,会丢失信息,导致检验效率下降, 犯第II类错误的可能性比参数检验大,即 ß值↑;
Ties
0c
Total
10
a.光 电 比 色 法 < 氰 化 高 铁 法
b.光 电 比 色 法 > 氰 化 高 铁 法
c.光 电 比 色 法 = 氰 化 高 铁 法
Test Statistics b
光电比色法 -
氰化高铁法
Z
-.459a
Asymp. Sig. (2-tailed)
.646
a. Based on negative ranks.
b. Wilcoxon Signed Ranks Test
秩和检验
30
第二节 两独立样本秩和检验 (Wilcoxon两样本比较法)
观测值X
A 7 14 22 36 40 48 63 98 B 3 5 6 10 17 18 20 39
X
41.00±29.81
14.75±11.73
方差齐性检验:
2.偏态分布资料
2019/9/17
秩和检验
7
何时使用非参数检验?
3.个别数据偏离过大资料
这里指的是随机的偏离而不属于“过失误差” 所致。还有一种情况就是数据的某一端无确定数 值,如“<0.01µg”,“>50mg”等等,只给一个上 限或下限,而没有具体数值。
4.各组离散程度相差悬殊(方差不齐)的资料
验算:T++T-=n(n+1)/2 4. 确定P值和作出推断结论
①小样本时(n≤50, n为d≠0的对子 数),通过查p226附表8(T界值表)得到P 值,原则是:若统计量T处于某T界值范 围之内,其P值大于或等于相应概率;反 之,则小于相应概率。当T值恰好等于附 表中的界值时,其确切概率常小于相应 的概率水平。
相关文档
最新文档