第十章基于秩次的非参数检验课件
合集下载
医学统计学 -第10章 基于秩次的非参数检验

Kruskal-Wallis H检验,用于推断计量资料或等级资料的 多个独立样本所来自的多个总体分布是否有差别。
H0:多个总体分布相同(或者中位数相等) H1:多个总体分布不同或不全相同(或者中位数不全相等)
26
例10.5
某医院用3种方法治疗15例胰腺癌患者,每种方 法各治疗5例,治疗后生存月数如下表,问3种方法的 疗效有无差别?
当n≤50时,通过查T界值表来确定是否波动过
大
T在界值范围内,波动不大
P>α
T在界值范围外或等于界值时,波动大,P≤α
11
(4) 查表及推断结论 查T界值表T0.05(16)=29~107 由于T=28在上下界值范围外,所以P≤0.05。 按a=0.05检验水准拒绝H0,接受H1,可以 认为该厂工人尿铅含量不当地正常人有差异, 通过正负秩和的大小可以推断工人的尿铅含 量要高于正常人。
第十章 基于秩次的非参数检验
1
假设检验的方法分为两类
参数检验(parametric test)
已知总体分布类型,对未知参数(μ、π)进行统计推断 依赖于特定分布类型,比较的是参数 一般有严格的适用条件
如:样本来自正态分布、总体方差齐同等 这类方法比如:t检验、F检验等
非参数检验(nonparametric test)
Z
T n1(N 1) / 2 0.5
n1n2 (N 3 N
12N(N 1)
(t
3 j
t
j
))
2036 40(84 1) / 2 0.5
40 44 (843 84 (323 32) (323 32) (203 20)) 12 40 (84 1)
7.01
由于Z=7.01,大于Z0.05=1.96,所以P<0.05,按照α=0.05 检验水准拒绝H0,接受H1,可以认为夏冬两季居民体 内核黄素含量有差别。根据平均秩次可以知道夏季的含
H0:多个总体分布相同(或者中位数相等) H1:多个总体分布不同或不全相同(或者中位数不全相等)
26
例10.5
某医院用3种方法治疗15例胰腺癌患者,每种方 法各治疗5例,治疗后生存月数如下表,问3种方法的 疗效有无差别?
当n≤50时,通过查T界值表来确定是否波动过
大
T在界值范围内,波动不大
P>α
T在界值范围外或等于界值时,波动大,P≤α
11
(4) 查表及推断结论 查T界值表T0.05(16)=29~107 由于T=28在上下界值范围外,所以P≤0.05。 按a=0.05检验水准拒绝H0,接受H1,可以 认为该厂工人尿铅含量不当地正常人有差异, 通过正负秩和的大小可以推断工人的尿铅含 量要高于正常人。
第十章 基于秩次的非参数检验
1
假设检验的方法分为两类
参数检验(parametric test)
已知总体分布类型,对未知参数(μ、π)进行统计推断 依赖于特定分布类型,比较的是参数 一般有严格的适用条件
如:样本来自正态分布、总体方差齐同等 这类方法比如:t检验、F检验等
非参数检验(nonparametric test)
Z
T n1(N 1) / 2 0.5
n1n2 (N 3 N
12N(N 1)
(t
3 j
t
j
))
2036 40(84 1) / 2 0.5
40 44 (843 84 (323 32) (323 32) (203 20)) 12 40 (84 1)
7.01
由于Z=7.01,大于Z0.05=1.96,所以P<0.05,按照α=0.05 检验水准拒绝H0,接受H1,可以认为夏冬两季居民体 内核黄素含量有差别。根据平均秩次可以知道夏季的含
第十章 基于秩次的非参数检验

?
? Zc=
T ? n(n?1)/ 4 ? 0.5 n(n?1)(2n?1)? (t3j ? tj)
24
48
? 式中(j=1,2,…)为第个相同秩次 (即平均秩次 )的个数,
假定有2个差值为“ 1.5”,3个差值为“ 6”,5差值为个
“13”,则 t=1 2, t 2=3, t3 =5,故有
? (t3j ? tj )=(23-2)+(33-3)+(53-5)=150
-1
-2
-3
0.62 -1.88 -12
0.78 -1.72 -10
2.13 -0.37 -5
2.48 -0.02 -1
2.54 -0.04
2
2.68 0.18
3
2.73 0.23
4
3.01 0.51
6
尿铅 差值di 含量di ? xi ? 2.50
-1
-2
秩次 -3
3.13 0.63
7
3.27 0.77
?
H0:差值的总体中位数等于零,即 Md=0
?
H1:差值的总体中位数不等于零,即 Md≠ 0
?
a= 0. 05
? 2.计算检验统计量 T值
? (1 ) 求差值d:
(2)编秩: 按差值的绝对值由小到大编秩,编秩 时,差值为 0,舍去不计;若差值的绝对值相等, 称为相持,这时取平均秩次,并按差值的正负给秩 次加上正负号。
? 例10-1 已知某地正常人尿铅含量的中位数 为2.50μmol/L。今在该地随机抽取16名工人, 测定尿铅含量见表10-1第(1)栏。问该厂工人 的尿铅含量是否高于当地正常人?
表10-1 某厂16名工人与当地正常人的尿铅含量(μmol/L)比较
10非参数秩和检验

n2=7
T2=134
Kruskal-Wallis test
(1) 建立假设检验
H0:四组鼠脾DNA含量的总体分布相同
H1:四组鼠脾DNA含量的总体分布位置不全相同 α=0.05
(2) 计算统计量
‣ 四个样本总例数N=8+7+9+8=32。将四样本32个观
察值统一由小到大编秩,见上表第(2)、(4)、(6)、 (8)列。在不同组中有相同含量值10.3两个,12.3三 个,均取各自的平均秩次。
Kruskal-Wallis test
Ti 2 12 H 3( N 1) N ( N 1) ni 1262 1342 123.5 2 54.5 2 12 3( 32 1) 19.90 32( 32 1) 8 7 9 8
Wilcoxon rank sum test
(3) 查表及结论
‣ n=n2-n1,查T界值表T0.05(4)=91~159,
两组患者的平均生存时间不同。
T1=162
落在界值范围外,所以P<0.05,拒绝H0,认为
二、正态近似法
例10-3 44例健康人与24例慢性气管炎病人痰液嗜酸 性粒细胞数的测量值(×106/L),问健康人与慢性 气管炎病人痰液嗜酸性粒细胞数有无显著差别?
0
计量 T 与总体的平均秩和应该相差不大;当与平均
秩相差太大时,超过了抽样误差可以解释的范围,
则 有 理 由 怀 疑 原 假 设 的 正 确 性 , 从 而 拒 绝 H0 。
(刘启贵)
的血清抗体滴度水平间差异是否有统计学意义?
抗体 滴度 (1) 1:10 1:20 1:40 1:80 1:160 1:320 合计 气 雾 组 皮下注 80亿 100亿 射组 (2) (3) (4) 2 15 10 5 1 — 33 4 7 12 7 2 — 32 2 1 13 9 5 1 31 累计 平均 秩次 (6) 4.5 20 49 77 91.5 96 秩 80亿 (7) 9 300 490 385 91.5 — 1275.5 100亿 (8) 18 140 588 539 183 — 1468 和 皮下 (9) 9 20 637 693 475.5 96 1912.5 和
基于秩次的非参数检验PPT课件

表10-4 某地居民夏冬两个季节体内核黄素营养状况比较
核黄素 营养状况
例数
夏季
冬季
合计 累积频数 秩次范围 平均秩次
缺乏
10
22
32
32
1~32
16.5
不足
14
18
32
64
33~64 48.5
适宜
16
4
20
84
65~84 74.5
合计
40
44
84
-
-
n140 T11.5 61 04.5 81 47.5 41 62036
绝对值|d| 1.88 1.72 0.37 0.02 0.04 0.18 0.23 0.51 0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
秩次 12 10 5 1 2 3 4 6 7 8 9 12 12 14 15 16
分配符号 -12 -10 -5 -1 2 3 4 6 7 8 9 12 12 14 15 16
9
3
14.9
13.5
1.4
3
3
4
30.2
27.6
2.6
8
8
5
8.4
9.1
-0.7
1.5
-1.5
6
7.7
7.0
0.7
1.5
1.5
7
16.4
14.7
1.7
5
5
8
19.5
17.2
2.3
6
6
9
127.0
155.0
-28.0
10
-10
10
18.7
16.3
第十章 基于秩次的非参数检验(本)_PPT幻灯片

(二)正态近似法
若n>25,超出T界值表的范围,可用正态 近似法作Z检验:
T nn 1 4
T n(n 1)(2n 1)/ 24
Z T T T nn 1 4 0.5
T
n(n 1)(2n 1)/ 24
式中0.5为连续性校正数。
如果相同秩次较多(不包括差值为0 者),应计算校正的Zc。
T nn1 4 0.5
0
77
65
-12
-10
91
90
-1
-1.5
70
65
-5
-5.5
71
80
9
9
88
81
-7
-8
87
72
-15
-11
T+=24.5, T-=41.5
H0:Md=0 (M1=M2) H1:Md≠0 (M1≠M2) α=0.05 求各对子的差值d; 编秩:按差值绝对值大小编秩并加上正负号,差值的绝对值
相同时取平均秩次;
治疗后 4.2 5.5 6.3 3.8 4.4 4.0 5.9 8.0 5.0
差值(d)
秩次
1.8
6.5
-0.7
-4.5
-1.8
-6.5
-0.4
-3
2.6
8
-0.2
-2
0.1
1
-4.5
-9
-0.7
-4.5
T+=15.5, T-=29.5
(二)方法步骤
H0:Md=0 H1:Md≠0
α=0.05
求各对子的差值d;
H0:Md=0 (即M=2.15) H1:Md>0 (即M>2.15) 单侧α=0.05
《医学统计学》第十章+非参数秩和检验

0.05
,即两个不同部位IL-6水平差值的总体中位数不为零
医学统计学(第7版)
符号秩和检验方法
(2)编秩次并求秩和统计量
首先求出各对数据的差值,见表的第(4)列;然后编秩次,按照差值绝
对值由小到大编秩,并按差值的正负给秩次加上正负号;若差值为“0”,舍
去不计,总的对子数也要减去此对子数(记为 n);若差值的绝对值相等,取
➢ 查表法:查 T 界值表(附表8),
T0.05(23) 73 ~ 203
,
T T 91 73
T 在此范围内,P >0.05, 按 α=0.05水准无理由拒绝 H0 ,即实行良好
的口腔卫生6个月后,尚不能说明此项干预对牙周改善有显著效果。
,
医学统计学(第7版)
(3) 确定P 值,做出推断
检测结果如下表(书中表10-1所示) 。
白癜风病人的不同部位白介素指标(pg/ml)
病人号
(1)
白斑部位
(2)
正常部位
(3)
d=(3)-(2)
秩次
(5)
1
2
3
4
5
6
7
8
合计
40.03
97.13
80.32
25.32
19.61
14.50
49.63
44.56
88.57
88.00
123.72
39.03
24.37
上表中第(1)列按第(2)与(3)列数据统一编秩号,第(5)列为各等级的平均秩次,
第(6)列则是较小样本的秩和,本例中 T=T1=560.5, 将其代入公式得出:
zc
| T n1 ( N 1) / 2 | 0.5
【统计学】9基于秩次的非参数检验

第一节 单样本和配对资料的符号秩和检验
• 单样本符号秩和检验 • 又称符号秩和检验(signed rank test ),差数秩和检验 • 适用:不能用单样本t检验进行分析的资料。 • 目的:是推断样本中位数与已知总体中位数是否相等。 • 例题:已知某地正常人尿铅含量的中位数为2.5微摩尔/升,今在
0.40 2 0.30 1.5 0.36 1 0.70 3 0.16 1 0.60 1
— 9.5
八月 测定值 秩次
0.35 1
0.30 1.5 0.50 2 0.10 1 0.80 2 1.55 2
—
9.5
56
方法一:
(1)编秩 每一区组(同一采样点)数据由小到大编秩。编秩时,若 有相同数据则取平均秩次,若第2行有2个0.3,均取原秩次1和2的平 均秩次1.5。
30
• 确定p值,下结论 • 查表得T0.05(12)=13-65, • 本例 T+=68, T-=10,不在范围之内,P<0.05 ,拒绝Ho,接受H1,
两种方法处理效果不同
31
两种方法治疗扁平足效果观察
病例号
原始记录 A法 B法
1
好
差
2
好
好
3
好
差
4
好
中
5
差
中
6
中
差
7
好
中
8
好
差
9
中
中
10
差
差
11
)
(
52 3
52
)
( 483 300 3
48 ) 300
(
62 3
62
)
( 98 3
98
统计学第十章 基于秩次的非参数检验

秩次 (5) 去掉 -2.5
2.5 -1 4 5 6 7 8 9 10 11 T+=62.5 T-=3.5
据经验本例测定指标值尿氟含量不 服从正态分布,不宜用t检验。
本例 n=11,T=3.5(单侧),用查 表法(附表9)。结果在界外, P<0.05,拒绝H0
第二节 完全随机设计两个独立样本比较的秩和检验
参数检验与非参数检验
参数检验(parametric test ):在已知总体分布类型的基础上,对总体参数进行估计和检验 非参数检验(nonparametric test ):总体分布类型未知,或非精确测量资料,或参数检验 的条件得不到满足时,对资料的分布规律及特征进行统计推断。 秩和检验、卡方检验、游程检验、序贯检验和Ridit分析都是非参数检验。
主要用于成组比较资料的检验,其方法步骤如下: 1.编秩 在原假设“H0:两总体分布相同”下,将两组数据混合由小到大统一编秩。 编 秩时如遇有原始数据相同的,则取它们的平均秩次。 2.求秩和并确定检验统计量 当两样本例数不等时,以样本例数小者为n1,其秩和为 统计量T;若n1=n2时,可任取一组的秩和为统计量T。 3.确定P值和作出结论 当n1≤10, n2 - n1≤10时,查成组设计T界值表(附表10)
4.确定P值和作出结论 : 当配对数n≤50时,查配对设计T界值表,T在界内,P> ;T 在界外,P≤ . 当配对数n>50时,可用正态近似法的Z检验
例 1
0-例10-1 研究保健食品对小鼠抗疲劳作用,资料见表10-1,推断不同剂量对肝糖原 1含量有无影响?
H0:不同剂量对肝糖原含量无影响 α=0.05
一、配对设计资料的符号秩和检验
主要用于配对资料的检验(H0:差值总体中位数Md=0),其方法步骤如下: 1.求差值: 求各对数据 ( xi , yi ) 的差值 di=xi-yi 2.编秩: 依差值的绝对数大小从小到大编秩,再根据差值的正、负给 秩冠以正负号。 编秩时,若差值为0,弃去不计;若遇有差值的绝对值相等,取其平均秩次。 3. 求秩和并确定检验统计量T : 分别求正、负秩次之和,记作T+和T-,并 以绝对值较 小者为T值
秩转换的非参数检验 ppt课件

35
T
较小例数组的秩和, min(R1 ,R 2 ),n1 n2
n1
n2
N n1 n2
n0 min( n1 ,n2 )
较小例数组的平均秩和为: n0(1 N)/2
若H0成立,T值应接近 n0(1 N)/2 ,若T值严重偏离
n0(1 N)/2,则提示H0可能是不正确的。小样本时,
(2)余下的 n 个差数按绝对值自小至大排秩号,但排好后秩号
要保持原差数的正负号;
(3)差数绝对值相等时,要以平均秩号表示;
3.求秩号和,即将正、负秩号分别相加,正负秩号绝对值之
和应等于 n(n 1) / 2 ,可用以核对。
ppt课件
21
4. 检验统计量 T 取较小一个秩和(或任取),根据 T 值查附表 9 进行判断,该表左侧为对子数,表身内部 是秩和,与上端纵标目之概率相对应。 判断标准:
(ti3 ti ) / 48
注意:仍为非参数检验
ppt课件
25
2.配对设计等级资料的符号秩检验
1. 把等级从弱到强转换成秩,如某指标的检测结果 为-,+,++,+++,可转化为相应的秩次1,2, 3,4;
2. 求各对秩次的差值,省略所有差值为0的对子数, 令余下的有效对子数为n;
3. 按n个差值编正秩与负秩,求正秩和与负秩和 注意:由于等级资料相同秩多,此时小样本的检 验结果会存在偏性,最好用大样本。
528
偏高 10
4
14 62~75 68.5
总秩和 : TA+TB=12(12+1)/2=78
ppt课件
11
A组(x) 3, 5, 7, 9 11
基于秩次的非参数检验

2. 编秩,求秩和,统计量为T=6.5 3. 确定P值:查表得到T界值为8~47。 4. 判断结果:6.5不在T界值范围内,则
P<0.05.
检验步骤
1. H0:差值的总体中位数为0。 H1:差值的总体中位数不为0。 α=0.05
2. 编秩,求秩和,统计量为T=3.5 3. 确定P值:查表得到T界值为13~65。 4. 判断结果:3.5不在T界值范围内,则
法。
七. 完全随机设计多个样本两两比较 的秩和检验(multiple comparisons)
1.建立假设 2.计算检验统计量并确定P值:
(1)计算k个处理组的平均勇秩于开和始;,才能找到成 (2)样本含量较小时,用精功确的法路 确定P值;样本含量
较大时,用正态近似法确定P值; 3.作出统计推断结论:
检验水准的调整:
八. 随机区组设计资料的多重比较
(multiple comparisons)
1.建立假设 2.计算检验统计量并确定P值:
(1)计算k个处理组的平均勇于秩开和始,;才能找到成 (2)样本含量较小时,用精功确的路法确定P值;样本含量较
大时,用正态近似法确定P值; 3.作出统计推断结论:
R×C表2检验
配伍组方 差分析
Fridman M检验
等级
Wilcoxon符 号秩和检验
Wilcoxon 符号秩和检
验
Wilcoxon秩和 检验
K-W H检验
Fridman M检验
基于秩次的非参数检验
2020年4月24日星期五
一.非参数统计的概念
1.参数统计:总体分布型已知,对总体参 数进行估计或检验。
2.非参数统计:不依赖于总体的分布型( 应用时可不考虑被研究对象为何种分布 或分布是否已知)。其优点是不受总体 分布的限定,适用范围广。但对适宜用 参数检验的资料,若用非参数检验,则 回损失部分信息,降低效率。
P<0.05.
检验步骤
1. H0:差值的总体中位数为0。 H1:差值的总体中位数不为0。 α=0.05
2. 编秩,求秩和,统计量为T=3.5 3. 确定P值:查表得到T界值为13~65。 4. 判断结果:3.5不在T界值范围内,则
法。
七. 完全随机设计多个样本两两比较 的秩和检验(multiple comparisons)
1.建立假设 2.计算检验统计量并确定P值:
(1)计算k个处理组的平均勇秩于开和始;,才能找到成 (2)样本含量较小时,用精功确的法路 确定P值;样本含量
较大时,用正态近似法确定P值; 3.作出统计推断结论:
检验水准的调整:
八. 随机区组设计资料的多重比较
(multiple comparisons)
1.建立假设 2.计算检验统计量并确定P值:
(1)计算k个处理组的平均勇于秩开和始,;才能找到成 (2)样本含量较小时,用精功确的路法确定P值;样本含量较
大时,用正态近似法确定P值; 3.作出统计推断结论:
R×C表2检验
配伍组方 差分析
Fridman M检验
等级
Wilcoxon符 号秩和检验
Wilcoxon 符号秩和检
验
Wilcoxon秩和 检验
K-W H检验
Fridman M检验
基于秩次的非参数检验
2020年4月24日星期五
一.非参数统计的概念
1.参数统计:总体分布型已知,对总体参 数进行估计或检验。
2.非参数统计:不依赖于总体的分布型( 应用时可不考虑被研究对象为何种分布 或分布是否已知)。其优点是不受总体 分布的限定,适用范围广。但对适宜用 参数检验的资料,若用非参数检验,则 回损失部分信息,降低效率。
医学统计学(课件)基于秩次的非参数检验

缺点:方法比较粗糙,对于符合参数检验条件者,采用 非参数检验会损失部分信息,其检验效能较低;样本含 量较大时,两者结论常相同
本章内容
配对设计和单样本资料的符号秩和检验 完全随机设计两组独立样本的秩和检验 完全随机设计多组独立样本的秩和检验
秩次与秩和
秩次(rank),秩统计量 是指全部观察值按某种顺序排列的位序。一般
对于分布不知是否正态的小样本资料,为保险起见,宜选 用非参数检验
对于一端或两端是不确定数值(如<0.5、>0.5等)的资料, 不管是否正态分布,只能选用非参数检验
对于等级资料,若选行×列表资料的卡方检验,只能推断 构成比差别,而选用非参数检验,可推断等级强度差别
参数检验
(parametric test)
秩和检验的目的是推断两个总体分布的位置是否有差 别,而不关心其分布的形状有无差别
两个总体分布位置不同,实际情况一般是两个总体分 布形状相同或类似,这时可简化为两个总体中位数不 等
一、两组连续变量资料的秩和检验
如果资料方差相等,且服从正态分布,就可以 用t检验比较两样本均数
如果此假定不成立或不能确定是否成立,就应 采用秩和检验来推断两样本分别代表的总体分 布是否不同
11.5 11(111) / 4 0.5
u
1.91
11(111)(2 111) (23 2)
24
48
u <1.96, 故P>0.05,在 0.05 水准上接受H0,拒绝H1, 结论与查表法相同。
注意
符号秩检验若用于配对的等级资料,则先把等 级从弱到强转换成秩(1,2,3,…);然后求各对 秩的差值,省略所有差值为0的对子数,令余下的有 效对子数为n;最后按n个差值编正秩和负秩,求正 秩和或负秩和。但对于等级资料,相同秩多,小样 本的检验结果会存在偏性,最好用大样本。
基于秩次的非参数检验PPT课件

差值经正态性检验得W=0.4561,P= 0.0001, 差值中存在极端值
18
编辑版ppt
表10-2 两法测定11份工业污水中氟离子浓度结果比较
样品号
氟离子浓度
差值d 差值秩次 分配符号
(1)
电极法(2) 分光光度法(3) (4)=(2)-(3)
1
10.5
8.8
1.7
4
4
2
21.6
18.8
2.8
9
基于秩次的非参数检验
1
编辑版ppt
基于秩次的非参数检验
单样本和配对设计资料的符号秩和检验 两组独立样本比较的秩和检验 多组独立样本比较的秩和检验 随机区组设计多组比较的秩和检验 案例讨论
2
编辑版ppt
非参数检验
假设检验方法分为参数检验和非参数检验 参数检验
以特定的总体分布为前提,对未知的总体参数做推 断
5
编辑版ppt
非参数检验
满足参数检验的资料采用非参数检验,会损失 数据信息,降低检验效能
秩和检验
常用的且检验效能较高的非参数检验方法 较完备的大样本抽样分布理论基础。 以秩和为检验统计量
6
编辑版ppt
单样本和配对设计资料的符号秩和检验
Wilcoxon符号秩和检验
推断总体中位数是否等于某个指定值(常数) 可用于单样本设计或配对设计,定量资料不满足参
查表法
根据n和T查附表9(配对比较的符号秩和检验) 若T值在上、下界值内,P值大于相应的概率; 若T值等于上、下界值,P值等于相应概率; 若T值在上、下界值范围外,P值小于相应的概率。 本例:n=16,T=108或28,查表得0.01<P<0.025
13
编辑版ppt
18
编辑版ppt
表10-2 两法测定11份工业污水中氟离子浓度结果比较
样品号
氟离子浓度
差值d 差值秩次 分配符号
(1)
电极法(2) 分光光度法(3) (4)=(2)-(3)
1
10.5
8.8
1.7
4
4
2
21.6
18.8
2.8
9
基于秩次的非参数检验
1
编辑版ppt
基于秩次的非参数检验
单样本和配对设计资料的符号秩和检验 两组独立样本比较的秩和检验 多组独立样本比较的秩和检验 随机区组设计多组比较的秩和检验 案例讨论
2
编辑版ppt
非参数检验
假设检验方法分为参数检验和非参数检验 参数检验
以特定的总体分布为前提,对未知的总体参数做推 断
5
编辑版ppt
非参数检验
满足参数检验的资料采用非参数检验,会损失 数据信息,降低检验效能
秩和检验
常用的且检验效能较高的非参数检验方法 较完备的大样本抽样分布理论基础。 以秩和为检验统计量
6
编辑版ppt
单样本和配对设计资料的符号秩和检验
Wilcoxon符号秩和检验
推断总体中位数是否等于某个指定值(常数) 可用于单样本设计或配对设计,定量资料不满足参
查表法
根据n和T查附表9(配对比较的符号秩和检验) 若T值在上、下界值内,P值大于相应的概率; 若T值等于上、下界值,P值等于相应概率; 若T值在上、下界值范围外,P值小于相应的概率。 本例:n=16,T=108或28,查表得0.01<P<0.025
13
编辑版ppt
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
缺点:方法比较粗糙,对于符合参数检验条件者,采用
非参数检验会损失部分信息,其检验效能较低;样本含
2020/9/24量较大时,两者结论常相同
10
一、非参数统计的概念
秩次:观察值由小到大排列后得到的秩序号, 当几个数据大小相同时,取平均秩次作 为其秩次。
秩和:用秩次代替原始数据求和得到。 秩和检验:用秩和进行假设检验的方法。
(甲,乙,丙,丁,戊)(很好,好,一般,差)
2020/9/24
等级资料?
2
以下资料如何进行统计推断呢?
•不服从正态分布的资 料 •多组资料满足正态分 布但方差不齐 •等级资料
2020/9/24
非参数检验方法!
3
第十章 基于秩次的非参数检验
nonparametric test
第十章 基于秩次的非参数检验
2020/9/24
11
本章介绍的非参数统计方法 均基于秩次
秩次(rank)——将数值变量值从小到大,或等级变量值从弱到
强所排列的序号。
例1 11只大鼠存活天数:
存活天数4,10,7,50,3,15,2,9,13,>60,>60
秩次 3 6 4 9 2 8 1 5 7 10 11
秩次相同(tie)取平均秩次!!
10.5 10.5
例2 7名 肺炎病人的治疗结果: 危险程度 治愈 治愈 死亡 无效 治愈 有效 治愈
秩次 1 2 7 6 3 5 4 平均秩次 2.5 2.5 7 6 2.5 5 2.5
2020/9/24
12
二、配对设计和单样本资料的符号秩和检验
(一)、 配对设计资料的符号秩和检验
例10-1 某研究者欲研究保健食品对小鼠抗疲劳作用,将同 种属的小鼠按性别和年龄相同、体重相近配成对子,共10 对,并将每对中的两只小鼠随机分到保健食品两个不同的 剂量组,过一定时期将小鼠杀死,测得其肝糖原含量 (mg/100g),结果见表10-1, 问不同剂量组的小鼠肝糖 原含量有无差别?
主要采用符号或等级排列(秩排列)来代替数据本身的分析 方法。它适用于任何分布类型资料的统计分析。秩和检验就是 一种非参数检验方法
2020/9/24
8
➢ 适用条件
参数统计: a.样本所在总体呈正态分布 b.各总体方差要齐 c.各个样本是相互独立的随机样本
非参数统计: a.不满足正态和方差齐性条件的小样本资料; b.总体分布类型不明的小样本资料; c.一端或二端是不确定数值(如<0.002、>65 等)的资料(必选); d.单向有序列联表资料(等级资料); e. 各种资料的初步分析。
血清铁 尿素氮
发铅含量 生存时间 上网时间
2020/9/24
统计方法回顾(1)
X S
t检验,方差分析
? 方差不齐
M(P25~P75)
? 偏峰分布或
分布未知
1
统计方法回顾(2)
镇痛效果 (有效,无效)
p
检2 验
确切概率法
检测结果
构成百分比(%)
(阳性,阴性) 满意度
(满意,一般,不满意)
肝炎类型
疗效
15
(一)、配对设计资料资料的符号秩和 检验(Wilcoxon配对法)
目的:
是推断配对样本差值的总体中位数是否和0有 差别,即推断配对的两个相关样本所来自的两个 总体中位数是否有差别。
符号检验:
是根据正、负符号进行假设检验的方法。将差 值按绝对值大小顺序定出正、负号,这样就将数 据信息转换为“+”、“-”符号的个数分布,据此 进行假设推断。
2020/9/24
13
表10-1 小鼠对号
(1) 1 2 3 4 5 6 7 8 9 10
不同剂量组小鼠肝糖原含量(mg/100g)
中剂量组 高剂量组
差值 d
(2)
(3)
(4)=(3)-(2)
620.16
958.47
338.31
866.50
838.42
-28.08
641.22
788.90
147.68
2020/9/24
16
本 例 配 对 样 本 差 值 经 正 态 性 检 验 , 推 断 得 总 体 不 服 从 正 态 分 布 , 现 用 W ilcox on符 号 秩 检 验 。
2020/9/24
17
二、配对设计和单样本资料的符号秩和 检验
812.91
815.20
2.29
738.96
783.17
44.21
899.38
910.92
11.54
760.78
758.49
-2.29
694.95
870.80
175.85
749.92
862.26
112.34
793.94
805.48
11.54
T 48.5
秩次
(5) 10 -5 8 1.5 6 3.5 -1.5 9 7检验
(parametric test)
已知总体分布类型,对 未知参数进行统计推断
非参数检验
(nonparametric test)
对总体的分布类型 不作严格要求
依赖于特定分布类 型,比较的是参数
不受分布类型的影响,比 较的是总体分布位置
优点:方法简便、易学易用,易于推广使用、 应用范围广;可用于参数检验难以处理的资料 (如等级资料,或含数值“>50mg”等 )
• 非参数统计的概念 • 配对设计和单样本资料的符号秩和检验 • 完全随机化设计两组独立样本的秩和检验 • 完全随机化设计多组独立样本的秩和检验 • 随机化区组设计资料的秩和检验 • 多个样本间的多重比较
2020/9/24
5
一、非参数统计的概念
参数统计与非参数统计
从总体中随机抽取一定含量的样本, 用样本指标估计(推断)总体指标,大 体上有两种方法。一是参数统计,另一 种是非参数统计。
T 6.5
2020/9/24
14
二、配对设计和单样本资料的符号秩和 检验
(一)、配对设计资料的Wilcoxon配对法 当配对设计计量资料不 具备参数检验的适用条件, 可采用符号秩和检验法。
它是将配对样本差 值的中位数与0作比较
•
2020/9/24
Frank Wilcoxon
(1892-1965)
2020/9/24
6
统计推断方法
假设检验
参数检验
非参数检验
t 检验
2020/9/24
方差分析
秩和检验
……
7
一、非参数统计的概念
参数统计与非参数统计
从总体中随机抽取一定含量的样本,用样本指标估计(推 断)总体指标,大体上有两种方法。一是参数统计,另一种是 非参数统计。 1、参数统计
指在总体分布类型已知的条件下,对其未知参数进行检验的 方法。要求独立、正态(方差齐),如t检验、F检验均属于参数 统计。 2、非参数统计