秩和检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多个样本比较得秩和检验 Kruskal-Wallis法,即H检验)
本法利用多个样本的秩和推断各样本分别代表的 总体的位置有无差别(即个总体的变量值有无倾向 性的不同)。它相当于单因素方差分析的非参数方 法,此法适用于有序分类资料及不宜用参数检验(F 检验)的数值变量资料,该法亦称为H检验。 包括直接法和频数表法
24
式中,分子0.5;连续性校正数, 因为T值是不连续的,而u分布 是连续的,这种校正,一般影响 甚微,常可略去
当相同“差值”(计绝对值)数多时(不包括差值为 0值),用式(11-.1)求得的u值偏小,应改用(11-2)校 正式。
u T nn 1 nn 12n 1 4 0.5
3 3 3
按式11-6计算
3
H 12 342 602 262 36 H c 3 15 1 / 1 6.39 3 C 1515 1 5 5 5 15 15
2 2 2 12 34 60 26 H 3 15 1 6 . 32 1515 1 5 5 5
5.确定P值,判断结果: 求得H值后,查表11-7(326页)三组比较秩和检验H 界值表. 当样本数或ni超出表中范围时,H得分布近似于自由 度为样本减1得X2分布,可查X2界值表,得P值,最后 按所取检验水准做出推断结论 如在编秩时未遇到相同得数值需计算平均秩次, 就可以此H 值与相应得临界值比较做出判断 .否则要按 下公式 计算 Hc值后再做判断。
第一节
配对设计差值的符号秩和检验 (wilcoxon配对法)
例9.1 对10 名健康人分别用离子交换法与蒸馏法,测得尿汞 值,如表11-.1中的(2)、(3)栏,问两法所得结果有无差别? 表 11-1 10名健康人用离子交换法与蒸馏法 测定尿汞值(μg/l)
编号 1) 1 2 3 4 5 6 7 8 9 10 离子交换法 蒸馏法 差数 秩次 ( 2) (3) (4)=(2)-(3) (5) 0.5 0.0 0.5 2 2.2 1.1 1.1 7 0.0 0.0 0.0 — 2.3 1.3 1.0 6 6.2 3.4 2.8 8 1.0 4.6 -3.6 -9 1.8 1.1 0.7 3.5 4.4 4.6 -0.2 -1 2.7 3.4 -0.7 -3.5 1.3 2.1 -0.8 -5 T+ = 26.5 T- =18.5
例2
频数表法
例11-3 :用某药治疗不同病情的老年慢性支气管炎患者, 疗效见表11-5第(1)、(2)两栏,此药对两种病情的老年慢性 支气管炎患者的疗效有无差别. 表11-5 某药对两种病情的老年慢性支气管炎患者的疗效
疗效 单纯性 单纯性 合并肺气肿 控制 65 42 显效 18 6 有效 30 23 无效 13 11 合计 126 82
1建立假设
基 本 步 骤
2编
秩
3求含量较小 的样本秩和T
1.查表法:
4.确定P值 判断结果
(2)正态近似法:
查附表
查表时,统计量T值在 上、下界值范围 内其P值大 ;若T值在上、下界值范围外 其P值小,若T值等于上、下界值范围, 其P值小于表中相应得概率
(2)正态近似法: 如果样本含量较大,表中查不到时,可用正态近似法作 检验,公式为:
4 确定P值: 判断结果 查表11-4两样本比较秩和检验用T界值表,双侧 检验,当n1=6,n2- n1=8-6=2时,40.5在29~61之间,P>0.05 按α=0.05水准不拒绝H0尚不能认为良种香烟得尼古丁含量 有差别。
本法得基本思想:
由上可见,假定含量分别为n1和n2得两个样本来 自同一总体(或分布相同得两个总体),则样本含 量为n1的样本的T与 平均秩和一般应相差不大.如相 差悬殊,超出了表11-4,按α水准的界值范围,表 示随机抽得现有样本统计量T值得概率很小,因而 在α水准上拒绝无效假设H0;相反,若P大于α则 不能拒绝无效假设H0。
T u
n1 N 1
2
0.5
n1 n 2 N 1 12
C
N n n2
式中: 1
当相源自文库秩次较多时,按式 11-3 计算得 u偏小,应采用矫正公 式:
uc u
其中
C 1 t j t j / N N
3
3
其中tj为第j个相同秩次得个数。
4、确定P值,判断结果 本例uc=0.541, 0.541<1.96 ,故P> 0.05,按α=0.05水准,不拒绝Ho,可认为该疗法对以上两种 病情的老年慢性支气管炎患者的疗效尚看不出差别。当经过 多个样本比较的秩和检验拒绝无效假设,认为各总体分布位 置不同或不全相同时,常需进一步两两比较
1建立假设:
检
验 步 骤
2编
秩:
分组计算秩和Ri
公式检验Ri
3求秩和
4计算检验 统计量H
的
Ri
计算是否正确
N ( N 1) 2
公式
5.确定P值, 判断结果:
Ri 12 H 3N 1 N N 1 ni
2
i 式中Ri 为第I个组的秩和,下标I表示组序(I=1,2,3,……),ni为其含量,N= n 为各组测定值之和。 5.确定P值,判断结果: 求得H值后,查表13(156页)三组比较秩和检验H界值表,当样本数或ni超出表中范围时,H得分布近似于自由度为 样本减1得X2分布,可查X2界值表,得P值,最后按所取检验水准做出推断结论
1 合计 秩次范围
107 1----107 24 108—131 53 132---184 24 185----208 208
平均秩次 秩和 单纯性 合并肺气肿 54 3510 2268 119.5 2151 717 158 4740 3634 24 2554.5 2161.5 R 12955.5 8780.5
甲术后 秩次 生存月数 3 4 7 10 7 10 6 7.5 2 2.5 乙术后 生存月数 9 12 11 8 5 秩次 13 15 14 12 6 60 丙术后 生存月数 1 2 6 4 7 秩次 1 2.5 7.5 5 10 26
Ri
Ni
5
-
34
5
5
1.建立假设 H 0:三个总体分布位置相同 H1:三个总体分布位置不同或不全相 α=0.05 2. 编秩 见表11-5第(2)(4)(6)栏。 3. 求秩和 见表11-5下部。 4. 计算检验统计量H值 本例先按式11-5计算
例1 直接法 某医院外科用三种手术方法资料肝癌患者 15例, 每组 5 例,进入各组得患者系用随机方法分配,每 例术后生存月数如表 11-5 得第( 1 )、( 3 )、( 5 ) 栏。试问三种不同手术方法治疗肝癌的效果有无差 别
表11-5 三种手术方法治疗肝癌患者的术后生存月数
3.优点:
无严格的条件限制,且多数非参数统计方法较 为简便,易于理解和掌握,故而应用范围广。
4. 缺点 但对适宜参数统计的资料,若用非参数统计 处理,常损失部分信息,降低检验效能. 因此对适合参数统计条件的资料或经变量变换 后适合参数统计的资料,应最好用参数统计。 但资料不具备用参数统计的条件时,非参数统 计是很有效的分析方法。
例1
直接法
为了比较甲乙两种香烟得尼古丁含量(mg),对甲种香烟做了6次测定,对 乙种香烟做了8次测定,数据见表11-3第(1)、(3)列,问这两种香烟得 尼古丁含量有无差别
表11-3 两种香烟尼古丁含量得秩和检 甲种香烟 秩次 乙种香烟 秩次 25 6 28 9.5 28 9.5 31 13 23 4 30 12 26 7 32 14 29 11 21 2 22 3 27 8 24 5 20 1
(1) 检验假设: Ho:差值总体中位数Md=0 H1:Md≠0 α=0.05
检 验 步 骤
(2) 求差值:
(3) 编秩: 依差值的绝对值从小到大编秩
遇差数等于零,舍去不计,同时样本例 数减1;遇绝对值相等差数,符号相顺 次编秩,符号相反取平均秩次
(4)求秩和并确定检验统计量T
(5)确定P值和作出推断结论
概念:
1参数检验:parametric statistics 总体分布类型已知的条件下,对其参数进行估计 或检验. 2非参数检验: non-parametric statistics 一种不依赖总体分布的具体形式,也不对参数进 行估计或检验的统计方法来分析此类资料 这种方法不受总体参数的影响,他检验的是分 布或分布的位置,而不是参数。这样的检验方法称 之为非参数检验。
n1 6
T1 40.5
n2 8
T2 64.5
1. 建立假设: H 0:两总体分布相同,或两总体位置分布相同 H1:两总体位置分布不同 α=0.05
2.编秩 : 将全部14个观察值从小到大标出其秩次,见表11-3第 (2)、(4)栏。中甲乙两种香烟测定值均有28,则应取其平 均秩次是 . 9 10 9.5 2 3计算: 以样本含量较少得组得秩和为T,本例n1=6,n2=8,则 T=40.5
Hc=H / C
式(11-6)
C 1
tj tj N N
3
3
本例有两个 2 (平均秩次 2.5 ),两个 6 (平均秩次均为 7.5 ) 和三个7(平均秩次均为10),故t1=2,,t2=2,t3=3代入
t j t j 2 2 2 2 3 3 36
代入公式:
u
8780 .5 82 208 1 0.5
C 1
tj tj
82 126 (208 1) / 12
3
0.4974
N3 N 1073 107 (243 24) 533 53 (243 24) 0.8443 3 208 208 04974 uc 0.541 0.8443
当n≤25 (n≤50)时,查 附表T界值表。
统计量值大于表中相应的界值时,则 P < 0.05
正态近似法:
若 n≥25( n>50 )超出附表11-2的范围,可用u检 验,按公式(11-1)计算u值,
u
n n 1 T
4
0.5
11-1
nn 12n 1
1 3 tj tj 24 48
式中,tj;第j(j=1,2,…)个相同差值的个数,假定差值中有 2个4,5个6, 3个7则t1=2,t2=5,t3=3
第二节 两样本比较的秩和检验 (Wilcoxon两样本比较法)
用于完全随机设计分组的两个样本数据比较。 本法是通过两个样本的观察值来推断两个总体的 分布位置是否相同,其检验假设是两个总体的分布位 置相同,备择假设是两个总体的分布位置不同。其基 本步骤如下:
秩和检验
Rank sum test
非参数检验
目的与要求
1 掌握非参数统计的概念、秩和检验的基本 思想、适用条件和优缺点。 2. 熟悉配对资料、两组级多组资料和等级分 组资料比较的秩和检验的方法和步骤 3.了解配伍组秩和检验的方法和步骤,了解 多组比较后进行的两两比较的假设检验方 法
1、建立假设 Ho:两个总体的疗效分布位置相同 H1:两个总体的疗效分布位置不全相同 α=0.05 2.编秩 3求秩和
对于单纯慢性支气管炎组: R=(65x54)+(18x119.5)+(30x158)+(13x196.5)=3510+2451+4740+ 2554.5=12955.5 对于单纯性合并肺气肿的慢性支气管炎组: R=(42x54)+(6x119.5)+(23x158)+(11x196.5)=2268+3634+2161.5+ 8780.5=8780.5 此例n1=82 n2=126 n1-n2=44,