第十章 基于秩次的非参数检验
医学统计学 -第10章 基于秩次的非参数检验

H0:多个总体分布相同(或者中位数相等) H1:多个总体分布不同或不全相同(或者中位数不全相等)
26
例10.5
某医院用3种方法治疗15例胰腺癌患者,每种方 法各治疗5例,治疗后生存月数如下表,问3种方法的 疗效有无差别?
当n≤50时,通过查T界值表来确定是否波动过
大
T在界值范围内,波动不大
P>α
T在界值范围外或等于界值时,波动大,P≤α
11
(4) 查表及推断结论 查T界值表T0.05(16)=29~107 由于T=28在上下界值范围外,所以P≤0.05。 按a=0.05检验水准拒绝H0,接受H1,可以 认为该厂工人尿铅含量不当地正常人有差异, 通过正负秩和的大小可以推断工人的尿铅含 量要高于正常人。
第十章 基于秩次的非参数检验
1
假设检验的方法分为两类
参数检验(parametric test)
已知总体分布类型,对未知参数(μ、π)进行统计推断 依赖于特定分布类型,比较的是参数 一般有严格的适用条件
如:样本来自正态分布、总体方差齐同等 这类方法比如:t检验、F检验等
非参数检验(nonparametric test)
Z
T n1(N 1) / 2 0.5
n1n2 (N 3 N
12N(N 1)
(t
3 j
t
j
))
2036 40(84 1) / 2 0.5
40 44 (843 84 (323 32) (323 32) (203 20)) 12 40 (84 1)
7.01
由于Z=7.01,大于Z0.05=1.96,所以P<0.05,按照α=0.05 检验水准拒绝H0,接受H1,可以认为夏冬两季居民体 内核黄素含量有差别。根据平均秩次可以知道夏季的含
基于秩次的非参数检验

基于秩次的非参数检验1. 问题的提出前面学习了连续型资料两组样本均数差异的假设检验方法:小样本用t检验,条件是变量服从正态分布和方差齐;大样本用标准正态分布的Z检验。
如果是小样本,变量的分布不清,或者已知不服从正态分布或经变量转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?需要一种不依赖于分布假定的检验方法,即非参数检验。
2. 基本概念前面介绍的检验方法首先假定分析变量服从特定的已知分布(如正态分布),然后对分布参数(如均数)作检验。
这类检验方法称参数检验(parametric test)。
今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量的中心位置或分布位置作比较。
这类检验称非参数检验(nonparametric test),由于其对总体分布不作严格假定,所以又称任意分布检验。
(distribution-free test)非参数检验的优点:a.不受总体分布的限制,适用范围广。
b.适宜定量模糊的变量和等级变量。
c.方法简便易学。
缺点:如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布(如正态分布),这时人为地将精确测量值变成顺序的秩,将丢失部分信息,造成检验功效能下降。
基于秩次非参数检验(秩和检验)的基本思想假设变量X有观察值1.1, 1.3, 1.7, 4.3, 11.4显然这变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。
但如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。
然后对这秩分布的中心位置(中位数)作检验,这就是秩和检验。
7.1 配对样本的符号秩检验(Wilcoxon signed rank test)例7.1为研究出生先后的孪生兄弟间智力是否存在差异,12对孪生兄弟测试的结果见表7.3。
表7.3 12对孪生兄弟测试结果T +=24.5,T -=41.5符号秩检验的分布理论:假定有4个差值,如果H 0成立时,这4个差值有同等的概率取正值或负值,即每个值取正值的概率等于1/2。
10非参数秩和检验

n2=7
T2=134
Kruskal-Wallis test
(1) 建立假设检验
H0:四组鼠脾DNA含量的总体分布相同
H1:四组鼠脾DNA含量的总体分布位置不全相同 α=0.05
(2) 计算统计量
‣ 四个样本总例数N=8+7+9+8=32。将四样本32个观
察值统一由小到大编秩,见上表第(2)、(4)、(6)、 (8)列。在不同组中有相同含量值10.3两个,12.3三 个,均取各自的平均秩次。
Kruskal-Wallis test
Ti 2 12 H 3( N 1) N ( N 1) ni 1262 1342 123.5 2 54.5 2 12 3( 32 1) 19.90 32( 32 1) 8 7 9 8
Wilcoxon rank sum test
(3) 查表及结论
‣ n=n2-n1,查T界值表T0.05(4)=91~159,
两组患者的平均生存时间不同。
T1=162
落在界值范围外,所以P<0.05,拒绝H0,认为
二、正态近似法
例10-3 44例健康人与24例慢性气管炎病人痰液嗜酸 性粒细胞数的测量值(×106/L),问健康人与慢性 气管炎病人痰液嗜酸性粒细胞数有无显著差别?
0
计量 T 与总体的平均秩和应该相差不大;当与平均
秩相差太大时,超过了抽样误差可以解释的范围,
则 有 理 由 怀 疑 原 假 设 的 正 确 性 , 从 而 拒 绝 H0 。
(刘启贵)
的血清抗体滴度水平间差异是否有统计学意义?
抗体 滴度 (1) 1:10 1:20 1:40 1:80 1:160 1:320 合计 气 雾 组 皮下注 80亿 100亿 射组 (2) (3) (4) 2 15 10 5 1 — 33 4 7 12 7 2 — 32 2 1 13 9 5 1 31 累计 平均 秩次 (6) 4.5 20 49 77 91.5 96 秩 80亿 (7) 9 300 490 385 91.5 — 1275.5 100亿 (8) 18 140 588 539 183 — 1468 和 皮下 (9) 9 20 637 693 475.5 96 1912.5 和
第十章基于秩次的非参数检验课件

缺点:方法比较粗糙,对于符合参数检验条件者,采用
非参数检验会损失部分信息,其检验效能较低;样本含
2020/9/24量较大时,两者结论常相同
10
一、非参数统计的概念
秩次:观察值由小到大排列后得到的秩序号, 当几个数据大小相同时,取平均秩次作 为其秩次。
秩和:用秩次代替原始数据求和得到。 秩和检验:用秩和进行假设检验的方法。
(甲,乙,丙,丁,戊)(很好,好,一般,差)
2020/9/24
等级资料?
2
以下资料如何进行统计推断呢?
•不服从正态分布的资 料 •多组资料满足正态分 布但方差不齐 •等级资料
2020/9/24
非参数检验方法!
3
第十章 基于秩次的非参数检验
nonparametric test
第十章 基于秩次的非参数检验
2020/9/24
11
本章介绍的非参数统计方法 均基于秩次
秩次(rank)——将数值变量值从小到大,或等级变量值从弱到
强所排列的序号。
例1 11只大鼠存活天数:
存活天数4,10,7,50,3,15,2,9,13,>60,>60
秩次 3 6 4 9 2 8 1 5 7 10 11
秩次相同(tie)取平均秩次!!
10.5 10.5
例2 7名 肺炎病人的治疗结果: 危险程度 治愈 治愈 死亡 无效 治愈 有效 治愈
秩次 1 2 7 6 3 5 4 平均秩次 2.5 2.5 7 6 2.5 5 2.5
2020/9/24
12
二、配对设计和单样本资料的符号秩和检验
(一)、 配对设计资料的符号秩和检验
例10-1 某研究者欲研究保健食品对小鼠抗疲劳作用,将同 种属的小鼠按性别和年龄相同、体重相近配成对子,共10 对,并将每对中的两只小鼠随机分到保健食品两个不同的 剂量组,过一定时期将小鼠杀死,测得其肝糖原含量 (mg/100g),结果见表10-1, 问不同剂量组的小鼠肝糖 原含量有无差别?
基于秩次的非参数检验PPT课件

表10-4 某地居民夏冬两个季节体内核黄素营养状况比较
核黄素 营养状况
例数
夏季
冬季
合计 累积频数 秩次范围 平均秩次
缺乏
10
22
32
32
1~32
16.5
不足
14
18
32
64
33~64 48.5
适宜
16
4
20
84
65~84 74.5
合计
40
44
84
-
-
n140 T11.5 61 04.5 81 47.5 41 62036
绝对值|d| 1.88 1.72 0.37 0.02 0.04 0.18 0.23 0.51 0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
秩次 12 10 5 1 2 3 4 6 7 8 9 12 12 14 15 16
分配符号 -12 -10 -5 -1 2 3 4 6 7 8 9 12 12 14 15 16
9
3
14.9
13.5
1.4
3
3
4
30.2
27.6
2.6
8
8
5
8.4
9.1
-0.7
1.5
-1.5
6
7.7
7.0
0.7
1.5
1.5
7
16.4
14.7
1.7
5
5
8
19.5
17.2
2.3
6
6
9
127.0
155.0
-28.0
10
-10
10
18.7
16.3
第十章 基于秩次的非参数检验(本)_PPT幻灯片

(二)正态近似法
若n>25,超出T界值表的范围,可用正态 近似法作Z检验:
T nn 1 4
T n(n 1)(2n 1)/ 24
Z T T T nn 1 4 0.5
T
n(n 1)(2n 1)/ 24
式中0.5为连续性校正数。
如果相同秩次较多(不包括差值为0 者),应计算校正的Zc。
T nn1 4 0.5
0
77
65
-12
-10
91
90
-1
-1.5
70
65
-5
-5.5
71
80
9
9
88
81
-7
-8
87
72
-15
-11
T+=24.5, T-=41.5
H0:Md=0 (M1=M2) H1:Md≠0 (M1≠M2) α=0.05 求各对子的差值d; 编秩:按差值绝对值大小编秩并加上正负号,差值的绝对值
相同时取平均秩次;
治疗后 4.2 5.5 6.3 3.8 4.4 4.0 5.9 8.0 5.0
差值(d)
秩次
1.8
6.5
-0.7
-4.5
-1.8
-6.5
-0.4
-3
2.6
8
-0.2
-2
0.1
1
-4.5
-9
-0.7
-4.5
T+=15.5, T-=29.5
(二)方法步骤
H0:Md=0 H1:Md≠0
α=0.05
求各对子的差值d;
H0:Md=0 (即M=2.15) H1:Md>0 (即M>2.15) 单侧α=0.05
《医学统计学》第十章+非参数秩和检验

0.05
,即两个不同部位IL-6水平差值的总体中位数不为零
医学统计学(第7版)
符号秩和检验方法
(2)编秩次并求秩和统计量
首先求出各对数据的差值,见表的第(4)列;然后编秩次,按照差值绝
对值由小到大编秩,并按差值的正负给秩次加上正负号;若差值为“0”,舍
去不计,总的对子数也要减去此对子数(记为 n);若差值的绝对值相等,取
➢ 查表法:查 T 界值表(附表8),
T0.05(23) 73 ~ 203
,
T T 91 73
T 在此范围内,P >0.05, 按 α=0.05水准无理由拒绝 H0 ,即实行良好
的口腔卫生6个月后,尚不能说明此项干预对牙周改善有显著效果。
,
医学统计学(第7版)
(3) 确定P 值,做出推断
检测结果如下表(书中表10-1所示) 。
白癜风病人的不同部位白介素指标(pg/ml)
病人号
(1)
白斑部位
(2)
正常部位
(3)
d=(3)-(2)
秩次
(5)
1
2
3
4
5
6
7
8
合计
40.03
97.13
80.32
25.32
19.61
14.50
49.63
44.56
88.57
88.00
123.72
39.03
24.37
上表中第(1)列按第(2)与(3)列数据统一编秩号,第(5)列为各等级的平均秩次,
第(6)列则是较小样本的秩和,本例中 T=T1=560.5, 将其代入公式得出:
zc
| T n1 ( N 1) / 2 | 0.5
第10章基于秩次的非参数检验教案

2662.5
1384.5
显效
27
37
64
126- 189
157.5
4252.5
5827.5
合计
69
120
189
7663
10292
H 0 : 两 种 药 物 疗 效 的 总 体 分 布 相 同
H 1 : 两 种 药 物 疗 效 的 总 体 分 布 相 同
0 .0 5
①先确定各等级的合计人数、秩范围和平 均秩,见表10-4的(4)栏、(5)栏和(6) 栏,再计算两样本各等级的秩和,见(7)栏 和(8)栏;
①省略所有差值为0的对子数,令余下的有效 对子数为n,见表10-1第(4)栏,本例 n=10;
➢若多个差值为0,可通过提高测量工具的精 度来解决。
②按差值的绝对值从小到大编秩,然后分别 冠以正负号。遇差值绝对值相等则取平均秩,称为 相同秩(ties)(样本较小时,如果相同秩较多, 检验结果会存在偏性,因此应提高测量精度,尽量 避免出现较多的相同秩), 表10-1第(4)栏差值的 绝对值为2.29有2个,其秩依次应为1,2,皆取平 均秩为1.5,见表10-1第(5).
式(10-4)计算校正的统计量值 Zc。
Zc
T n(n 1)/ 4 0.5
n(n 1)(2n 1)
(t
3 j
t
j
)
24
48
(10-4)
式中tj 为第j(j=1,2…)次相持所含相同秩次的个数。如例10-1,第1 次相持,
有两个差值的绝对值均为 2.29,则 t1=2;第 2 次相持,有两个差值均为 11.54,
由于秩统计量的分布与原数据总体分布
无关,具有较好的稳健性,可用于任何分 布类型的资料。
非参数检验

2011-01-09
36
(1)建立检验假设
H0
H1
:肺炎患者与正常人的血铁蛋白总体分布相同 :肺炎患者与正常人血铁蛋白总体分布不同
α =0.05
(2)计算检验统计量 T 值 编秩 将两组数据合起来由小到大统一编秩,即从小到大编号,最 小的数据的秩为 1,第二小的数据的秩为 2,依此类推。编秩时如遇 有相同数据,且相同数据在不同组时,要取其平均秩次,例如,本 例中有两个数据均为 68,应编秩次为 11,12,取平均秩次(11+12) /2=11.5。若相同数据在同一组,可取平均秩次,也可不取,如本例 中有 3 个 47,可编秩次 6、7、8,也可取其平均秩次为 7。
0 -0.05 0.05 -0.03 0.27 0.37 0.47 0.57 0.84 1.04 1.22 2.42
0 -0.05 -2.5 0.05 2.5 0.03 -1 0.27 4 0.37 5 0.47 6 0.57 7 0.84 8 1.04 9 1.22 10 2.42 11
29
(2)编秩,方法同上。 (3)求秩和T+=62.5,T-=3.5,取T=3.5。 3.确定P值,做出推断结论 本例n=11,T=3.5,查T界值表得P<0.05,按
2011-01-09
11
第二节
配对设计和单样本资料 的符号秩和检验
2011-01-09
12
【案例1】
留取12名在医用仪表厂工作的工人尿液,分成两份,一份用 离子交换法,另一份用蒸馏法测得尿汞值如下,问两种方法 测得尿汞值平均含量有无差别? 表1
编 号 离子交换法 蒸馏法 1 0.200 0.320
20
校正公式:
zc = T − n(n + 1) / 4 − 0.5 n(n + 1)(2n + 1) ∑ (t j − t j ) − 24 48
第十章基于秩次的非参数检验

53-99
55-105
…
47-97
49-103
51-109
45-99
47-105
49-111
…
…
…
…
说明
• 如果n1或n2-n1超出了T界值表的范围, 可用正态近似检验。
正态近似法
当n1>10或(n2-n1)>10时
连续性校正
Z T n1 (n1 n2 1) 2 0.5
n1n2 (n出1 现n2相1同) 1的2 数据 若Z值超过标准正态分布的临界值,则拒绝 H0;若出现相持较多,则用下式进行校正
秩次
8
7
6
0.3
1
2.2
6
3.5
9
10
n2=8
表1 高中生与大学生的每周平均上网时间比较(小时/周)
高中生
上网时间
秩次
0.5
2 2.5
3
1
4
0.5
3 2.5
11
1.5
5
2.5
7
3.5
n1=8
大学生
上网时间
秩次
8
7
6
0.3
1
2.2
6
3.5
9
10
n2=8
表1 高中生与大学生的每周平均上网时间比较(小时/周)
α=0.05
秩和检验的步骤
2. 编秩
3.
将两组数据由小到大统一编秩,编
秩时如遇有相同数据,取平均秩次。
4. 3. 求秩和
5.
两组秩次分别相加。
6. 4. 确定统计量
7.
若两组例数相等,则任取一组的秩
和为统计量,若两组例数不等,则以样本
基于秩的非参数检验介绍

基于秩的非参数检验介绍秩检验是一种常用的非参数检验方法,它不依赖于总体的具体分布形式,适用于数据不满足正态分布等假设的情况。
秩检验的核心思想是将原始数据转化为秩次,通过比较秩次的大小来进行假设检验。
本文将介绍基于秩的非参数检验的原理、常见的秩检验方法以及如何应用秩检验进行统计推断。
### 一、秩的概念在介绍秩检验之前,首先需要了解秩的概念。
秩是指将一组数据按照大小顺序排列后得到的位置序号,即数据在排序后的位置。
例如,对于一组数据{5, 3, 7, 2},排序后的序列为{2, 3, 5, 7},则对应的秩次为{2, 1, 3, 4}。
### 二、秩和秩次的计算在进行秩检验时,需要计算每个数据点的秩次。
对于有重复数值的情况,可以采用两种方法计算秩次:一是平均秩法,即将重复数值的秩次取平均值;二是顺序秩法,即按照数据出现的先后顺序依次赋予秩次。
### 三、秩和秩次的应用秩和秩次在非参数检验中起着重要作用。
在进行秩检验时,常用的方法包括Wilcoxon秩和检验、Mann-Whitney U检验、Kruskal-Wallis 检验等。
这些方法都是基于秩次进行统计推断,适用于不同类型的假设检验问题。
1. Wilcoxon秩和检验Wilcoxon秩和检验是一种用于比较两组相关样本的非参数检验方法。
它的原假设是两组样本来自同一总体,备择假设是两组样本来自不同总体。
通过比较两组样本的秩和来判断它们是否存在显著差异。
2. Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两组独立样本的非参数检验方法。
它的原假设是两组样本来自同一总体,备择假设是两组样本来自不同总体。
通过比较两组样本的秩和来进行假设检验。
3. Kruskal-Wallis检验Kruskal-Wallis检验是一种用于比较多组独立样本的非参数检验方法。
它的原假设是多组样本来自同一总体,备择假设是多组样本来自不同总体。
通过比较多组样本的秩和来进行假设检验。
医学统计学(课件)基于秩次的非参数检验

缺点:方法比较粗糙,对于符合参数检验条件者,采用 非参数检验会损失部分信息,其检验效能较低;样本含 量较大时,两者结论常相同
本章内容
配对设计和单样本资料的符号秩和检验 完全随机设计两组独立样本的秩和检验 完全随机设计多组独立样本的秩和检验
秩次与秩和
秩次(rank),秩统计量 是指全部观察值按某种顺序排列的位序。一般
对于分布不知是否正态的小样本资料,为保险起见,宜选 用非参数检验
对于一端或两端是不确定数值(如<0.5、>0.5等)的资料, 不管是否正态分布,只能选用非参数检验
对于等级资料,若选行×列表资料的卡方检验,只能推断 构成比差别,而选用非参数检验,可推断等级强度差别
参数检验
(parametric test)
秩和检验的目的是推断两个总体分布的位置是否有差 别,而不关心其分布的形状有无差别
两个总体分布位置不同,实际情况一般是两个总体分 布形状相同或类似,这时可简化为两个总体中位数不 等
一、两组连续变量资料的秩和检验
如果资料方差相等,且服从正态分布,就可以 用t检验比较两样本均数
如果此假定不成立或不能确定是否成立,就应 采用秩和检验来推断两样本分别代表的总体分 布是否不同
11.5 11(111) / 4 0.5
u
1.91
11(111)(2 111) (23 2)
24
48
u <1.96, 故P>0.05,在 0.05 水准上接受H0,拒绝H1, 结论与查表法相同。
注意
符号秩检验若用于配对的等级资料,则先把等 级从弱到强转换成秩(1,2,3,…);然后求各对 秩的差值,省略所有差值为0的对子数,令余下的有 效对子数为n;最后按n个差值编正秩和负秩,求正 秩和或负秩和。但对于等级资料,相同秩多,小样 本的检验结果会存在偏性,最好用大样本。
基于秩次的非参数检验讲义

n2=15
T2=189.0
例题分析
解: H0:甲、乙两河流断面亚硝酸盐氮含量的总体分布相同 H1:甲、乙两河流断面亚硝酸盐氮含量的总体分布不相同
n1=10 , n2-n1=5 , α=0.05(双) T=136 ,查附表10,得 [94 ,166 ] , T在界内, P>0.05,不拒绝H0,不能认为甲、乙两河流断面亚硝酸盐 氮含量的总体分布不相同。
T在界内,P> ; T在界外,P≤ . 当n1>10 或 n2 - n1>10时,可用正态近似法的Z检验
1.两组连续变量资料的秩和检验
例10-3
亚硝酸盐氮含量(mg/L)的检测结果
河流甲
河流乙
含量值
秩次
含量值
秩次
0.014
1
0.018
2.5
0.018
2.5
0.019
4
0.024
8.5
0.020
(3) Wilcoxon 配对法基本思想
本法的基本思想是假定两种处理结果的效应相同,即差值之总体 分布是对称的(H0:Md=0) ,总体中位数为0;同理,假定某种处理 无作用,则 每一受试对象处理前后所得结果之差值的总体中位数亦 为0。如果假设成立,则样本的正、负秩和应比较接近;若正、负秩 和相差悬殊,即T特别小,则假设成立的可能性也小。
基于秩次的非参数检验PPT课件

18
编辑版ppt
表10-2 两法测定11份工业污水中氟离子浓度结果比较
样品号
氟离子浓度
差值d 差值秩次 分配符号
(1)
电极法(2) 分光光度法(3) (4)=(2)-(3)
1
10.5
8.8
1.7
4
4
2
21.6
18.8
2.8
9
基于秩次的非参数检验
1
编辑版ppt
基于秩次的非参数检验
单样本和配对设计资料的符号秩和检验 两组独立样本比较的秩和检验 多组独立样本比较的秩和检验 随机区组设计多组比较的秩和检验 案例讨论
2
编辑版ppt
非参数检验
假设检验方法分为参数检验和非参数检验 参数检验
以特定的总体分布为前提,对未知的总体参数做推 断
5
编辑版ppt
非参数检验
满足参数检验的资料采用非参数检验,会损失 数据信息,降低检验效能
秩和检验
常用的且检验效能较高的非参数检验方法 较完备的大样本抽样分布理论基础。 以秩和为检验统计量
6
编辑版ppt
单样本和配对设计资料的符号秩和检验
Wilcoxon符号秩和检验
推断总体中位数是否等于某个指定值(常数) 可用于单样本设计或配对设计,定量资料不满足参
查表法
根据n和T查附表9(配对比较的符号秩和检验) 若T值在上、下界值内,P值大于相应的概率; 若T值等于上、下界值,P值等于相应概率; 若T值在上、下界值范围外,P值小于相应的概率。 本例:n=16,T=108或28,查表得0.01<P<0.025
13
编辑版ppt
医学统计 第10章 基于秩次的非参数检验 (NXPowerLite)

第二节 两组独立样本比较的秩和检验
1. 两组连续变量资料的秩和检验 ; 2. 两组有序变量资料的秩和检验 。
第十章 基于秩次的非参数检验
张晋昕
2008.10.21
1
t 检验中的拒绝域和支持域
2
参数与非参数统计方法
参数统计(parametric statistics)
例如:t 检验和方差分析。
非参数统计(nonparametric statistics) 例如:秩和检验(rank sum test)。
尿铅含量
xi
0.62 0.78 2.13 2.48 2.54 2.68 2.73 3.01
差值 d i di xi 2.50
-1.88 -1.72 -0.37 -0.02 -0.04 0.18 0.23 0.51
秩次
-12 -10 -5 -1 2 3 4 6
尿铅含量
xi
3.13 3.27 3.54 4.38 4.38 5.05 6.08 11.27
15
一、定量变量两组独立样本的秩和检验
表 10-3 两种药物杀灭钉螺死亡率(%)的比较
甲药
乙药
死亡率(%)
秩次
死亡率(%)
秩次
32.5
5.5
16.0
1
35.5
7
22.5
2
40.5
10
26.0
3
40.5
10
28.5
第十章 基于秩次的非参数检验

?
? Zc=
T ? n(n?1)/ 4 ? 0.5 n(n?1)(2n?1)? (t3j ? tj)
24
48
? 式中(j=1,2,…)为第个相同秩次 (即平均秩次 )的个数,
假定有2个差值为“ 1.5”,3个差值为“ 6”,5差值为个
“13”,则 t=1 2, t 2=3, t3 =5,故有
? (t3j ? tj )=(23-2)+(33-3)+(53-5)=150
-1
-2
-3
0.62 -1.88 -12
0.78 -1.72 -10
2.13 -0.37 -5
2.48 -0.02 -1
2.54 -0.04
2
2.68 0.18
3
2.73 0.23
4
3.01 0.51
6
尿铅 差值di 含量di ? xi ? 2.50
-1
-2
秩次 -3
3.13 0.63
7
3.27 0.77
?
H0:差值的总体中位数等于零,即 Md=0
?
H1:差值的总体中位数不等于零,即 Md≠ 0
?
a= 0. 05
? 2.计算检验统计量 T值
? (1 ) 求差值d:
(2)编秩: 按差值的绝对值由小到大编秩,编秩 时,差值为 0,舍去不计;若差值的绝对值相等, 称为相持,这时取平均秩次,并按差值的正负给秩 次加上正负号。
? 例10-1 已知某地正常人尿铅含量的中位数 为2.50μmol/L。今在该地随机抽取16名工人, 测定尿铅含量见表10-1第(1)栏。问该厂工人 的尿铅含量是否高于当地正常人?
表10-1 某厂16名工人与当地正常人的尿铅含量(μmol/L)比较
10 基于秩次的非参数检验

第十章基于秩次的非参数检验[教学要求]了解:通过电脑实验了解不同设计类型的秩和检验和相应t检验的功效有何不同。
熟悉:理解非参数统计的概念;熟悉不同设计类型的秩和检验方法。
掌握:掌握不同设计类型的秩和检验的实施方法及其应用条件。
[重点难点]第一节正确理解非参数统计的概念在统计学中,最基本的概念是总体和样本、随机变量、分布和假设检验,其中很大一部分内容是和正态理论相关的,总体的分布形式或分布族往往是给定的或是假定了的,所不知道的仅仅是一些参数的值或他们的范围,人们的任务就是对一些参数(如均值和方差或标准差)进行点估计或区间估计,或者对某些参数进行各种检验,如最常用χFt2的统计量、统计量、统计量均基于正态总体这一假设。
在实际中,对总体分布的假定并非能随便作出,数据可能不是来自所假定分布的总体,或根本不是来自一个总体,或因为种种原因被污染。
在假定总体分布的情况下进行推断可能产生错误甚至灾难性的结论。
于是人们希望在不假定总体分布的情况下,尽量从数据本身获得所需要的信息,这正是非参数统计的宗旨。
非参数统计是一个很广阔的研究领域,本章涉及的仅是基本的秩和检验。
非参数统计方法不利用关于总体分布的知识,即便在对于总体的任何知识都没有的情况下,也容易而又很可靠地获得结论,这是非参数方法优于参数方法的一面;在总体分布族已知的情况下,不需要任何先验知识就成为它的缺点,由于没有充分利用已知的关于总体分布的信息,所作出的结论就不如参数方法得到的精确。
在不知总体分布的情况下如何利用数据所包含的信息呢?一组数据的最基本信息是次序,将数值按大小次序排队,每个数值在整个数据中均有相应的位置和次序,称为该数据的秩(rank)。
在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。
以上便是非参数统计的基本思想。
注意,非参数(nonparametric) 意味着其方法不涉及特定的总体分布,又称任意分布(distribution-free)或称与分布无关,是因其推断方法和总体分布无关,不应理解为与所有分布(例如有关秩的分布)无关。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十章基于秩次的非参数检验习题
一、选择题
1.两小样本均数比较,方差不齐时,下列说法不正确的是().
A. 采用秩和检验
B. 采用t′检验
C. 仍用t检验
D. 变量变换后再作决定
E. 要结合正态性检验结果方能作出决定
H是().
2. 两样本秩和检验的
A. 两样本秩和相等
B. 两总体分布相同
C. 两样本分布相同
D. 两总体秩和相等
E. 两总体均数相等
3. 在统计检验中是否选用非参数统计方法().
A. 要根据研究目的和数据特征作决定
B. 可在算出几个统计量和得出初步结论后进行选择
C. 要看哪个统计结论符合专业理论
D. 要看哪个P值更小
E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用
4. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是().
A. T越大,P值越小
B.T越大,P值越大
C. T值在界值范围内,P值小于相应的α
D. T值在界值范围内,P值大于相应的α
E. T值在界值范围上,P值大于相应的α
5. 成组设计两样本比较的秩和检验,其检验统计量T是().
A. 为了查T界值表方便,一般以秩和较小者为T
B. 为了查T界值表方便,一般以秩和较大者为T
C. 为了查T界值表方便,一般以例数较小者秩和为T
D. 为了查T界值表方便,一般以例数较大者秩和为T
E. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表
多样本定量资料比较,当分布类型不清时应选择().
A. 方差分析
B. t检验
C. Z检验
D. Kruskal-Wallis检验
E. Wilcoxon检验
6. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后
H值,则会().
的
c
A.提高检验的灵敏度
B.把一些无差别的总体推断成有差别
C. 把一些有差别的总体推断成无差别
D.Ⅰ、Ⅱ类错误概率不变
E. 以上说法均不对
二、简答题
1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法?
2. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?
3. 多组定量资料比较时,统计处理的基本流程是什么?。