第九章 非参数检验方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例9.1 临床某医生研究白癜风病人的白介素IL-6水平 (u/ml)在白癍部位与正常部位有无差异,调查的资料 如下表:
表9-1 白癜风病人的不同部位白介素IL-6指标(u/ml)
病人号 1 2 3 4 5 6 7 8 合计
白癍部位 40.03 97.13 80.32 25.32 19.61 14.50 49.63 44.56
正常部位 88.57 80.00 123.72 39.03 24.37 92.75 121.57 89.76
d=正常-白癍 48.54 -17.13 43.40 13.71 4.76 78.25 71.94 45.20 T+=33
秩次 6 -3 4 2 1 8 7 5 T-=3
一般步骤和基本思想
一、一般步骤 1、建立假设检验,确定检验水准
u
T T
T
当相同秩次较多时(>25%),采用校正公式:
其中ti为相同秩次的个数
二、基本思想
如果H0成立,即差值总体的中位数为0,则理论上样本的正 负 秩 和 应 相 等 , 即 T 值 应 为 总 秩 和 n(n+1)/2 的 一 半 , 即 T=n(n+1)/4。由于存在抽样误差,T应该接近n(n+1)/4,T越小,
3、查表,确定P值范围
n≤25时,查配对资料符号秩和检验用T界值表,T在
界值内时,P>α。当T在界值时或以外时,P值一般都 小于对应的概率值。
n>25时,近似正态分布用u检验,公式为:
2 T~ ( T , T )
T n(n 1) / 4 T n(n 1)(2n 1) / 24
例9.3 对无淋巴 细胞转移与有淋 巴细胞转移的胃 癌患者,观察其 生存时间,问两 组患者的生存时 间是否不同?
表9-4 两组患者生存时间(月)
无淋巴细胞转移 时间 12 25 27 秩次 4.5 10 11 有淋巴细胞转移 时间 5 8 12 秩次 1 2 4.5
29
38 42 46 46 56 60
1.计量资料的多个样本比较 2.等级资料的多个样本比较
基本思想和步骤
(一)基本思想:如果各组来自同一总体,即H0成立时,对 各组观测值混合编秩次后,各组的平均秩和应近似相等;否 则拒绝H0,可以推断数据的总体分布不同。 (二)步骤 1、建立假设检验 H0:各抽样总体分布相同
H1:各抽样总体的分布不同或不全相同
T4=54.5
13.6
n2=7 T2=134 n3=9
25
T3=123.5
1、建立假设检验确定检验水准
H0:四组鼠脾DNA含量的总体分布相同;
H1:四组鼠脾DNA含量的总体的分布不同或不全相同 ;
α=0.05。
2、计算统计量
3、查表及结论
现k=4,υ=k-1=4-1=3查卡方界值表χ20.05(3)=7.81,P<0.05按 α=0.05水准,拒绝H0,接受H1,故可认为四组DNA含量有差别。
T1=216
11.6
12.3 12.7 13.5 13.5 14.8
13
18 21 23 24 27
10.3
11.1 11.7 11.7 12.0 12.3 12.4
3.5
11 14 15 16 18 20
10.3
10.5 10.5 10.5 10.9 11.0 11.5
n4=8
3.5
5 6 7 9 10 12
2
3 合计
2 5
2 4
7
6
11~17
18~23
14.0
20.5
28
41 T-=91
70
82 T+=185
3、查表与结论
查T界值,T0.05(23)=73~203
T=min(T+,T-)=T-=91>73,P>0.05,按α=0.05水准,不拒绝H0, 即对28名有轻度牙周疾病的成年人,指导他们实行良好的口腔卫 生习惯,6个月后,牙周情况尚无显著好转。
H0:差值总体中位数为0;
H1:差值总体中位数不为0 ;
α=0.05
2、计算统计量
(1)按差值的绝对值自小到大排秩次,并保留原差数的
正负号;
(2)差数的绝对值相等,但符号相反时,取平均秩次;
(3)差数为零时,弃之,总的对子数相应减少; (4)将正负秩次分别相加,得到T+和T-,并以绝对值较 小者作为统计量T值。
例9.4 44例健康人与24例慢性气管炎病人痰液嗜酸性粒 细胞数的测量值(×1016/L),问健康人与慢性气管炎 病人痰液嗜酸性粒细胞数有无显著性差别?
表9-5-1两组人痰嗜酸性粒细胞比较
嗜酸性粒细胞数
组别 健康人 病人 5 11 + 18 10 ++ 16 3 +++ 5 0 合计 44 24
合计
+ ++ +++ 合计
1、建立假设检验及确定检验水准 H0:两组总体分布相同;
H1 :两组总体分布不相同;
α=0.05。
2、计算统计量
3、确定P值,作出统计推断 由于u0.05=1.96,u> u0.05,P<0.05,有统计学意义,所以 拒绝H0,接受H1,可认为两总体分布不同。
第三节 多个样本比较的秩和检验 应用情况
查u值表,u0.05=1.96,u< u0.05 ,P>0.05,按α=0.05水准,接受H0。 两种方法结果相同。
第二节 两样本比较的秩和检验
一、一般步骤 1、建立假设检验及确定显著水准 H0:两总体分布相同; H1:两总体分布不同; α=0.05。
2、计算统计量 (1)编秩号 两样本观察值从小到大混合编秩,属于不同组的相同观察值取 原秩次的平均秩次。 (2)求秩和,确定统计量T n1和n2为两样本含量,N= n1+n2。分别计算秩次T1和T2,取样 本含量小的n的秩和T为统计量T值。当n1=n2,取任 意T值。
表9-6 各组鼠脾DNA含量(mg)的秩和计算
正常脾
患自发性白血 病脾
患移植白血病的脾 (甲组)
患移植白血病的脾 (乙组)
含量 秩次
12.3 18
含量 秩次
10.8 8
含量
9.3
秩次
1
含量
9.5
秩次
2
13.2
13.7 15.2 15.8 16.9 17.3 17.4
n1=8
22
26 28 29 30 31 32
α =0.05。 2、计算统计量 将两样本24个数据由小到大统一编秩。两组例数各为 10、14,取较小者为n1=10,T1=162,故统计量 T=T1=162。
3、查表与结论
n2-n1=4,按α=0.05,查T值表(附表9)得范围 91~159。T=162>159,所以P<0.05,拒绝H0,即两组 患者的平均生存时间不同。
第九章 非参数检验方法
金英良
流行病与卫生统计学教研室
主要内容:
第一节 配对资料的符号秩和检验 第二节 两样本比较的秩和检验 第三节 多个样本比较的秩和检验
基本概念
1.参数检验(parametric test) 以特定的总体分布为前提,对总体参数进行估计或 假设检验的一类检验方法。 由样本统计量推断未知总体参数。 这时,对总体参数μ 、π 进行估计或假设检验称为参数 检验。 分布:要求总体分布已知,如: •计量资料——正态分布;
16
28
19
5
能否用卡方检验?
表9-5-2
嗜酸性 粒细胞 数
两组人痰嗜酸性粒细胞的秩和计算
例数 健康人 5 18 16 5 44 病人 11 10 3 0 24 范围 1-16 17-44 45-63 64-68
例数较小组 的秩和 平均秩次 8.5 30.5 54.0 66.0 93.5 305.0 162.0 0.0 T1=560.5
. . . . . . .
+3 +2 +1 0 -1 -2 -3
4 5 6 5 4 2 2
1、建立假设检验
H0:差值总体中位数为0; H1:差值总体中位数不为0;
α=0.05。
2、计算统计量
表9-3 正负秩和计算表 d 1 - + 总 4 6 10 秩次范围 1~10 平均秩次 5.5 负秩和 22 正秩和 33
T与n(n+1)/4的差距越大,相应的P值就越小。当P ≤α时,拒绝
H0。
Biblioteka Baidu
1、建立假设检验,确定检验水准
H0:差值总体中位数为0;
H1:差值总体中位数不为0;
α=0.05。
2、计算统计量
T=min(T+,T-)= T-=3
3、查表及结论 n=8,界值表T0.05(8)=3~33,T=3恰好落在界点上,所以 P≤0.05,按α=0.05水准,拒绝H0 ,可认为白癍部位与 正常部位的白介素IL-6有差异。
3.常用的非参数检验方法有:符号检验、秩和 检验、等级相关检验及Radit分析等。
秩和检验(rank sum test):用秩号代替原始数据后, 所得某些秩号之和,称为秩和,用秩和进行假设检验 即为秩和检验。
举例:
“秩”即按数据大小排定的次序号,又称秩号。编秩就是将观察 值按顺序由小到大排列,所得某些秩次号之和,即按某种顺序 排列的序号之和,称为秩和。设有以下两组数据: A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7
例9.6 霍乱菌苗不同途径免疫21天后血清抗体滴度水平 测定结果,问各组间的血清抗体滴度水平之间差异是否 有统计学意义?
表9-7 不同途径免疫21天后血清抗体滴度的分布与秩和计算 抗体 滴度 1:10 1:20 1:40 1:80 1:160 1:320 合计 气雾组 80 亿 2 15 10 5 1 33 100 亿 4 7 12 7 2 32 皮下 注射 组 2 1 13 9 5 1 31 累 计 8 23 秩次范 围 1-8 9-31 平均 秩次 4.5 20 49 77 91.5 96 秩和 80亿
3、确定P值
当n小<10,n大-n小≤10时,查附表9的T界值表。T值在表中范围 外(包括端点时),P值小于表中对应的概率值,T值在表中范 围内,P值大于表中对应的概率值。 当n大和n小超过T界值表的范围时,可按近似正态,用u检验:
当秩次较多时,用校 正公式:
二、基本思想
在H0成立的条件下,n1样本的秩和T应该接近平均秩和 n1(N+1)/2(N为处理组的总例数)。如果二者的偏离 程度超出了给定范围,表示得到样本统计量T的概率很 小(P<α),则有理由拒绝H0。
12.5
17 19 20 21 23 24
12
12 17 21 24 29 30 34 36 40 48
4.5
4.5 7 8 9 12.5 14 15 16 18 22
n1=10
T1=162
n2=14
T2=138
1、建立假设检验及确定检验水准
H0:两组生存时间总体分布相同; H1 :两组生存时间总体分布不相同;
优点:应用范围广,方法简便。 缺点:检验效率低。犯第二类错误的可能性大 于参数检验法。
对于适合参数统计的资料或经变 量变换后适合于参数统计的资料, 最好还是用参数检验。
第一节 配对资料的符号秩和检验
配对资料的符号秩和检验(Wilcoxon signed rank test)是配对设计的非参数检验。
•计 数 资 料——二项分布、POISSON分布等。
2.非参数检验 (nonparametric test) 可以不考虑总体的参数和总体的分布类型,而 对总体的分布或分布位置进行检验。
样本所来自的总体分布,难以用某种函数形式来表达, 还有一些资料的总体分布的函数式是未知的,只知道总 体分布是连续型的或离散型的,解决这类问题需要一种 不依赖总体分布的具体形式的统计方法。
A组 2.6 3.2 4.7 5.2 6.4 B组 1.7 2.3 2.6 3.6 3.7 秩次 1 2 3 4 5 6 7 8 9 10
适用情况
2.等级资料;
1.总体分布为偏态或分布形式未知的计量资料;
3.个别数据偏大或数据的某一端无确定的数值;
4.各组离散程度相差悬殊,即各总体方差不齐。
优缺点
例9.2 对28名患有轻度牙周疾病的成年人,指导他们实 行良好的口腔卫生习惯,6个月后,牙周情况好转程度 依高到低给予分数+3,+2,+1;牙周情况变差程度依 次给予分数-1,-2,-3;没有变化给予0分。
表9-2 实行良好口腔卫生习惯6个月后牙周情况的变化程度
6个月后
6个月前
变化对应的分数
人数
. . . . . . .
2、计算统计量
α=0.05
(1)编秩次,将各组数据从小到大统一编秩次,如不同组有 相同数值,应取平均秩次。 (2)求秩和, 分别计算各组的Ti。
(3)计算统计量:
计算公式:
当相同秩次较多时(尤其为等级资料),采用校正的HC
H或HC近似服从自由度ν=k-1的χ2分布。按χ2的界值表确定P的范 围。
例9.5 研究白血病时,测定四组鼠脾DNA的含量,结果 见下表,试分析各组DNA含量有无差别?