10非参数秩和检验
非参数统计符号秩和检验
桂林电子科技大学 数学与计算科学学院实验报告院系 数学与计算科学学院 学号姓名成绩课程 名称 非参数统计实验 实验项目 名 称第三讲 符号秩和检验一 ,实验目的1.理解符号秩和检验的基本思想;2.会用Minitab 软件进行统计分析; 3 .能够用Minitab 软件解决实际问题。
二,实验原理2.1 符号检验统计量(1) 关于对称中心θ是否为原点的符号秩和检验统计量:ini i R u W ∑=+=1,其中1,0,1,2,...,.0,0i i ix u i n x >⎧==⎨≤⎩i R 为ix 的秩.当ix 的秩重复时,则采用平均秩的方法计算。
符号秩和检验统计量+W 不仅有样本数据是正数还是负数的信息,而且还有样本数据值大小的信息.它是符号检验的改进. 2.2符号秩和检验的基本思想对给定的置信水平α.(1) 对于检验假设01:0,:0H H θθ=<,若检验P 值(P W +≤()012,,...,n W x x x +)α<,(其中()012,,...,n W x x x +是由样本12,,...,n x x x 代入W +算出的统计量值)。
则拒绝0H 。
(1:0H θ<类似)(2) 对于检验假设01:0,:0H H θθ=≠,由12,,...,n x x x 算出W +的值若≤ (1)/4n n +时,检验P 值为2(P W +≤由12,,...,n x x x 算出的W +的值)α<,由12,,...,n x x x 算出的W +得值≥ (1)/4n n +时,检验P 值为2(P W +≥由12,,...,n x x x 算出的W +的值);(3) 当检验P 值大于α时,接受原假设0H ,否则拒接原假设0H 。
三,实验内容为了检验两种燃料添加剂对客车每加仑汽油行驶里程数的影响是否不同,随机挑选12辆车,让每一辆车都先后使用这两种添加剂,12辆车使用这两种添加剂每加仑汽油行驶里程数的检验结果如下:车辆添加剂车辆添加剂1 2 1 21 22.32 21.25 7 18.36 19.402 25.76 23.97 8 20.75 17.183 24.23 24.77 9 24.07 22.234 21.35 19.26 10 26.43 23.355 23.43 23.12 11 25.41 24.986 26.97 26.00 12 27.22 25.90试检验:这两种添加剂有没有差异?四,实验过程原始记录(数据,图表,计算等)1.输入数据,并计算差值.2.符号秩和检验分析:3.结果:Wilcoxon 符号秩检验: C3中位数 = 0.000000 与中位数≠ 0.000000 的检验Wilcoxon 估计中N 检验 N 统计量 P 位数C3 12 12 70.0 0.017 1.2304.由输出结果可以看出,12对样本数据差值的估计中位数为1.230,统计量W 大小为7验P值=0.017<0.05,所以拒接原假设,认为对称中心不为0,即认为这两种添加剂有差异五,实验结果分析或总结通过这次实验,我理解了符号秩和检验的基本思想;学会了用Minitab软件进行统计分析。
医学统计学 -第10章 基于秩次的非参数检验
H0:多个总体分布相同(或者中位数相等) H1:多个总体分布不同或不全相同(或者中位数不全相等)
26
例10.5
某医院用3种方法治疗15例胰腺癌患者,每种方 法各治疗5例,治疗后生存月数如下表,问3种方法的 疗效有无差别?
当n≤50时,通过查T界值表来确定是否波动过
大
T在界值范围内,波动不大
P>α
T在界值范围外或等于界值时,波动大,P≤α
11
(4) 查表及推断结论 查T界值表T0.05(16)=29~107 由于T=28在上下界值范围外,所以P≤0.05。 按a=0.05检验水准拒绝H0,接受H1,可以 认为该厂工人尿铅含量不当地正常人有差异, 通过正负秩和的大小可以推断工人的尿铅含 量要高于正常人。
第十章 基于秩次的非参数检验
1
假设检验的方法分为两类
参数检验(parametric test)
已知总体分布类型,对未知参数(μ、π)进行统计推断 依赖于特定分布类型,比较的是参数 一般有严格的适用条件
如:样本来自正态分布、总体方差齐同等 这类方法比如:t检验、F检验等
非参数检验(nonparametric test)
Z
T n1(N 1) / 2 0.5
n1n2 (N 3 N
12N(N 1)
(t
3 j
t
j
))
2036 40(84 1) / 2 0.5
40 44 (843 84 (323 32) (323 32) (203 20)) 12 40 (84 1)
7.01
由于Z=7.01,大于Z0.05=1.96,所以P<0.05,按照α=0.05 检验水准拒绝H0,接受H1,可以认为夏冬两季居民体 内核黄素含量有差别。根据平均秩次可以知道夏季的含
非参数检验sas程序(秩和检验)
1、单个样本或配对资料
• • • • • • • • • data tmp; do i=1 to 30; x = round(rannor(235624)*24+125,0.01); output; end; run; proc univariate data=tmp; var x; run;
2、两组以上比较
• • • • • •
; run; proc nparlway data=tmp6 wilcoxcon; class a; var a; run;
例4、 39名吸烟工人和40名不吸烟工人的碳氧血红蛋白HbCO(%)含量见表8-6。问 吸烟工人的HbCO(%)含量是否高于不吸烟工人的HbCO(%)含量?
例7、 四种疾病患者痰液内嗜酸性白细胞的检查结果见表8-11。 问四种疾病患者痰液内的嗜酸性白细胞有无差别?
表7 四种疾病患者痰液内的嗜酸性白细胞比较 病毒性呼 支气管 平均 白细胞 肺水肿 肺癌 合计 秩范围 扩张 吸道感染 秩 ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻ 0 3 5 3 11 6 1~11 + 2 5 7 5 19 12~30 21 ++ 9 5 3 3 20 31~50 40.5 +++ 6 2 2 0 10 51~60 55.5 739.5 436.5 409.5 244.5 ─ ─ ─ 17.0 15 17 11 60 ─ ─ 43.50 29.10 24.09 22.23 ─ ─ ─
医学统计学与SAS软件
非参数检验
NPAR1WAY 过程
• PROC NPAR1WAY <options> ; • BY variables ; • CLASS variable ; • EXACT statistic-options </ computationoptions> ; • FREQ variable ; • OUTPUT <OUT= SAS-data-set> <options> ; • VAR variables ;
10非参数秩和检验
10非参数秩和检验非参数秩和检验(也称为Wilcoxon秩和检验)是一种用于比较两组独立样本的统计方法。
这种方法不要求数据符合特定的分布假设,因此适用于各种不同类型的数据。
在本文中,我将介绍非参数秩和检验的原理、步骤以及如何应用它来比较两组独立样本。
非参数秩和检验的原理基于秩数的概念。
当我们比较两组独立样本时,我们可以将所有的数据点按照大小顺序进行排列,并为它们分配一个秩数。
然后,我们将计算每个数据点的秩和,然后比较两组数据的秩和来判断它们之间是否存在显著差异。
非参数秩和检验的步骤如下:1.将两组独立样本的数据合并,并按照大小顺序排列。
2.为每个数据点分配一个秩数,如果有重复值,则取平均秩。
3.计算每个样本的秩和,即将该组数据对应的秩数相加。
4.计算两组数据的秩和之差。
5.根据差异的大小和样本量,计算检验统计量。
6.根据检验统计量和自由度,在显著性水平为α的情况下确定是否拒绝原假设。
假设我们有两组独立样本,需要比较它们的平均值是否存在显著差异。
我们可以使用非参数秩和检验来进行这种比较。
下面是一个示例:假设我们有两组学生的数学成绩数据,第一组有30名学生,第二组有25名学生。
我们想要知道这两组学生的数学成绩是否存在显著差异。
首先,我们将两组学生的数学成绩数据合并,并按照大小顺序进行排列。
然后,为每个数据点分配一个秩数。
如果有重复值,则取平均秩。
接下来,计算每组学生的秩和,然后计算两组学生的秩和之差。
最后,根据差异的大小和样本量,计算检验统计量,并确定在显著性水平为α的情况下是否拒绝原假设。
非参数秩和检验的优点在于它不要求数据符合特定的分布假设,因此对于数据不满足正态分布的情况下具有更强的鲁棒性。
此外,它还可以处理有序分类变量或等距变量的分析,适用范围比较广泛。
总结一下,非参数秩和检验是一种用于比较两组独立样本的统计方法,适用于各种不同类型的数据,具有较强的鲁棒性和广泛的适用范围。
在实际应用中,可以通过计算检验统计量来判断两组数据之间是否存在显著差异,从而做出相应的统计推断。
第十二章秩和检验10讲
2020/7/22
21
(2)公式法 当n1或n2-n1超出附表11的范围,可按公式 (12.3)求统计量z值。
T n1(N 1) 0.5
Z
2
n1n2 (N 1)
12
(12.3)
式中N= n1+ n2。当相同的秩次较多时(超过25%), 应按公式(12.4)对z值进行校正,z值经校正后略大,P值
2020/7/22
28
表12.5 三种卵巢功能异常患者血清促黄体素的含量(U/L)
卵巢发育不良
丘脑性闭经
垂体性闭经
促黄体铜含量 秩次 促黄体铜含量 秩次 促黄体铜含量 秩次
31.38
17
1.67
1
1.90
3
33.60
18
1.74
2
2.10
4
35.12
19
3.32
6
2.75
5
35.76
20
4.59
7.5
式中:tj为第j(j=1,2,…)个相同差值的个数。假如差值中有2
个3,3个5,3个6,则
(
t
3 j
t
j
)
=(23-2)+(33-3)+
(33-3)=54。
2020/7/22
12
本法的基本思想是:若两组处理的效应相同,则每对变 量的差值之总体分布是以0对称的,即差数的总体中位数为0。 说明在H0成立的条件下,样本的T+和T-应相近,均应接近均 数n(n+1)/4 ;反之,若样本的T+和T-相差较大,距均数 n(n+1)/4较远,即由抽样误差所致的可能性较小,当P≤α时, 就拒绝H0。
2020/7/22
非参数统计中的秩和检验方法详解(十)
非参数统计中的秩和检验方法详解统计学是一门研究数据收集、分析、解释和呈现的学科。
在统计学中,参数统计和非参数统计是两种不同的方法。
参数统计依赖于总体参数的假设,而非参数统计则不依赖于总体参数的假设。
在本文中,我们将详细介绍非参数统计中的秩和检验方法。
一、秩和检验的概念秩和检验是一种常用的非参数统计方法,用于比较两个或多个总体的位置参数。
在进行秩和检验时,首先要对样本数据进行排序,然后用秩次替换原始观测值,最后对秩和进行比较,以得出结论。
二、秩和检验的原理秩和检验的原理基于总体分布的位置参数。
当我们无法对总体分布做出具体的假设时,可以使用秩和检验方法来比较两个或多个总体的位置参数。
在进行秩和检验时,我们需要计算每个样本的秩次和,然后根据秩和的大小来进行假设检验。
三、Wilcoxon秩和检验Wilcoxon秩和检验是一种常用的秩和检验方法,用于比较两个相关样本或者两个独立样本的位置参数。
在进行Wilcoxon秩和检验时,首先要对样本数据进行排序,然后用秩次替换原始观测值,最后对秩和进行比较,以得出结论。
Wilcoxon秩和检验是一种非参数检验方法,不依赖于总体分布的假设,因此在实际应用中具有较广泛的适用性。
四、Mann-Whitney U检验Mann-Whitney U检验是一种常用的秩和检验方法,用于比较两个独立样本的位置参数。
在进行Mann-Whitney U检验时,首先要对两个样本数据进行合并并进行排序,然后用秩次替换原始观测值,最后根据秩和的大小来进行假设检验。
Mann-Whitney U检验也是一种非参数检验方法,适用于总体分布未知或不满足正态分布假设的情况。
五、Kruskal-Wallis H检验Kruskal-Wallis H检验是一种常用的秩和检验方法,用于比较多个独立样本的位置参数。
在进行Kruskal-Wallis H检验时,首先要对多个样本数据进行合并并进行排序,然后用秩次替换原始观测值,最后根据秩和的大小来进行假设检验。
非参数统计中的秩和检验方法详解(Ⅰ)
非参数统计中的秩和检验方法详解统计学是一门研究数据收集、分析、解释和展示的学科,它在各个领域都有着广泛的应用。
而在统计学中,参数统计和非参数统计是两种常见的方法。
参数统计是根据总体的参数进行推断,而非参数统计则是不对总体参数做出假设的一种统计方法。
在非参数统计中,秩和检验方法是一种常用且重要的方法。
本文将详细介绍非参数统计中的秩和检验方法。
一、秩和检验简介秩和检验是一种基于秩次的非参数检验方法,它主要用于对两个独立样本或多个相关样本的总体分布进行比较。
这种方法的优势在于对数据的分布形状没有要求,适用于各种类型的数据。
在进行秩和检验时,首先需要将样本数据进行排序,然后根据排序后的秩次进行计算。
接下来,通过比较秩和的大小来进行假设检验,从而得出结论。
二、秩和检验的应用场景秩和检验方法可以应用于诸多实际场景中。
比如,在医学研究中,可以用秩和检验方法来比较两种不同治疗方法的疗效;在工程领域,可以用秩和检验方法来比较不同生产工艺的产品质量;在市场营销中,可以用秩和检验方法来比较不同促销策略的效果等等。
总之,秩和检验方法在实际问题的解决中有着广泛的应用。
三、秩和检验的类型秩和检验包括了许多不同类型,其中最常见的包括Mann-Whitney U检验、Wilcoxon秩和检验和Kruskal-Wallis H检验。
下面将分别对这些检验进行详细介绍。
1. Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两个独立样本的非参数检验方法。
它基于两组数据的秩次进行比较,通过计算秩和来判断两组数据是否来自同一总体分布。
Mann-Whitney U检验的原假设是两组样本来自同一总体分布,备择假设是两组样本来自不同总体分布。
通过计算U统计量和p值来进行假设检验,从而得出结论。
2. Wilcoxon秩和检验Wilcoxon秩和检验是一种用于比较两个相关样本的非参数检验方法。
它与Mann-Whitney U检验类似,同样是基于秩次进行比较。
《医学统计学》第十章+非参数秩和检验
0.05
,即两个不同部位IL-6水平差值的总体中位数不为零
医学统计学(第7版)
符号秩和检验方法
(2)编秩次并求秩和统计量
首先求出各对数据的差值,见表的第(4)列;然后编秩次,按照差值绝
对值由小到大编秩,并按差值的正负给秩次加上正负号;若差值为“0”,舍
去不计,总的对子数也要减去此对子数(记为 n);若差值的绝对值相等,取
➢ 查表法:查 T 界值表(附表8),
T0.05(23) 73 ~ 203
,
T T 91 73
T 在此范围内,P >0.05, 按 α=0.05水准无理由拒绝 H0 ,即实行良好
的口腔卫生6个月后,尚不能说明此项干预对牙周改善有显著效果。
,
医学统计学(第7版)
(3) 确定P 值,做出推断
检测结果如下表(书中表10-1所示) 。
白癜风病人的不同部位白介素指标(pg/ml)
病人号
(1)
白斑部位
(2)
正常部位
(3)
d=(3)-(2)
秩次
(5)
1
2
3
4
5
6
7
8
合计
40.03
97.13
80.32
25.32
19.61
14.50
49.63
44.56
88.57
88.00
123.72
39.03
24.37
上表中第(1)列按第(2)与(3)列数据统一编秩号,第(5)列为各等级的平均秩次,
第(6)列则是较小样本的秩和,本例中 T=T1=560.5, 将其代入公式得出:
zc
| T n1 ( N 1) / 2 | 0.5
非参数检验,秩和检验法(Mann-Whitney检验法)(检验两组产品强度是否有差异)
拒绝原假设,认为 原假设不成立,备 选假设成立。认为 改善前后产品的强 度有显著差异
就谈到这,欢迎大家交流!
分析目的:判定改善前后产品的强度是否有显著差异?
看看一个分析的例子
用秩和检验(Mann-Whitney检验),用秩和方式判定两组数据是否有显著差 异 原假设(H0):η改善前-η改善后= 0;备择假设(H1):η改善前-η改善后 ≠ 0
求p值:若p<0.05;则认为改善前后的强度值有显著差异
分析方法
非参数检验 秩和检验法(Mann-Whitney检验法) 例子:检验两组产品强度是否有差异
大家好!今天我们谈谈:如何利用Minitab来进行秩和检验
秩是对应数值由大到小的,例 如有100个数据都不一样的 话,最大的数值对应的秩就是 100,最小的就是1
有重复数据时候,会按同名称 排列;如数值最大数有一个1 个则秩为最大值(例如100), 数值第二大有2个一样的则对 应的秩就是一样的(例如都 为98,98),第三数值最大的 一个秩就是97了
数据 12 13 14 14 15 16 19 19 19 21 23
秩1
2 3.5 3.5 5
6
8
8
8 10 11
先了解一下,秩的概念
两组数据,分别记为A和B:
A组 19.95 20.17 19.78 19.99 19.94 20.17 19.99 20.15 19.94
B组 17.95 18.15 16.72 19.11 18.94 19.27 19.10 17.15
步骤一:将A组数据和B组数 据混在一起进行排秩,
步骤二:排秩后,分别求A 组数据和B组数据的秩和
医学统计学精品教学第十章-非参数检验精品文档
1
第十章 非参数秩和检验
吴库生 汕头大学医学院预防医学教研室
参数统计与非参数统计
1、参数统计(parametric statistics) 样本所来自的总体分布具有某个已知
的函数形式(如正态分布),而其中有 的参数是未知的,统计分析的目的是对 这些未知的参数进行估计或检验。
2019/10/13
28
符号秩和检验的SPSS实现
2019/10/13
秩和检验
29
Wilcoxon Signed Ranks Test
结 果
Ranks
N Mean RankSum of Ranks
光 电 比 色 法 -Negative Ranks
5a
氰 化 高 铁 法 Positive Ranks
5b
4.60 6.40
X
41.00±29.81
14.75±11.73
方差齐性检验:
F
S12(大) S22(小)
864.94816.2863 137.5929
F F0.05,(7,7) 4.99
P<0.05
两样本方差不齐,不能应用t检验
2019/10/13
医学统计学-秩和检验
31
采用Wilcoxon两独立样本秩和检验
10
Contents
第一节 配对资料的符号秩和检验(Wilcoxon配对法) 第二节 两独立样本比较的秩和检验(Wilcoxon两样本
法) 第三节 完全随机设计多个样本比较的秩和检验
(Kruskal-Wallis检验)
2019/10/13
秩和检验
11
第一节 两配对样本差值的符号秩和检验 (Wilcoxon signed rank test)
第10章基于秩次的非参数检验教案
2662.5
1384.5
显效
27
37
64
126- 189
157.5
4252.5
5827.5
合计
69
120
189
7663
10292
H 0 : 两 种 药 物 疗 效 的 总 体 分 布 相 同
H 1 : 两 种 药 物 疗 效 的 总 体 分 布 相 同
0 .0 5
①先确定各等级的合计人数、秩范围和平 均秩,见表10-4的(4)栏、(5)栏和(6) 栏,再计算两样本各等级的秩和,见(7)栏 和(8)栏;
①省略所有差值为0的对子数,令余下的有效 对子数为n,见表10-1第(4)栏,本例 n=10;
➢若多个差值为0,可通过提高测量工具的精 度来解决。
②按差值的绝对值从小到大编秩,然后分别 冠以正负号。遇差值绝对值相等则取平均秩,称为 相同秩(ties)(样本较小时,如果相同秩较多, 检验结果会存在偏性,因此应提高测量精度,尽量 避免出现较多的相同秩), 表10-1第(4)栏差值的 绝对值为2.29有2个,其秩依次应为1,2,皆取平 均秩为1.5,见表10-1第(5).
式(10-4)计算校正的统计量值 Zc。
Zc
T n(n 1)/ 4 0.5
n(n 1)(2n 1)
(t
3 j
t
j
)
24
48
(10-4)
式中tj 为第j(j=1,2…)次相持所含相同秩次的个数。如例10-1,第1 次相持,
有两个差值的绝对值均为 2.29,则 t1=2;第 2 次相持,有两个差值均为 11.54,
由于秩统计量的分布与原数据总体分布
无关,具有较好的稳健性,可用于任何分 布类型的资料。
(完整)非参数统计wilcoxon秩和检验
Wilcoxon 秩和检验Wilcoxon 符号秩检验是由威尔科克森(F·Wilcoxon)于1945年提出的.该方法是在成对观测数据的符号检验基础上发展起来的,比传统的单独用正负号的检验更加有效。
1947年,Mann 和Whitney 对Wilcoxon 秩和检验进行补充,得到Wilcoxon —Mann-Whitney 检验,由后续的Mann-Whitney 检验又继而得到Mann —Whitney-U 检验。
一、 两样本的Wilcoxon 秩和检验由Mann ,Whitney 和Wilcoxon 三人共同设计的一种检验,有时也称为Wilcoxon 秩和检验,用来决定两个独立样本是否来自相同的或相等的总体.如果这两个独立样本来自正态分布和具有相同方差时,我们可以采用t 检验比较均值。
但当这两个条件都不能确定时,我们常替换t 检验法为Wilcoxon 秩和检验。
Wilcoxon 秩和检验是基于样本数据秩和。
先将两样本看成是单一样本(混合样本)然后由小到大排列观察值统一编秩.如果原假设两个独立样本来自相同的总体为真,那么秩将大约均匀分布在两个样本中,即小的、中等的、大的秩值应该大约均匀被分在两个样本中。
如果备选假设两个独立样本来自不相同的总体为真,那么其中一个样本将会有更多的小秩值,这样就会得到一个较小的秩和;另一个样本将会有更多的大秩值,因此就会得到一个较大的秩和。
设两个独立样本为:第一个x 的样本容量为1n ,第二个y 样本容量为2n ,在容量为21n n n +=的混合样本(第一个和第二个)中,x 样本的秩和为x W ,y 样本的秩和为y W ,且有2)1(21+=+++=+n n n W W y x (1)我们定义 2)1(111+-=n n W W x (2) 2)1(222+-=n n W W y (3)以x 样本为例,若它们在混合样本中享有最小的1n 个秩,于是2)1(11+=n n W x ,也是x W 可能取的最小值;同样y W 可能取的最小值为2)1(22+n n 。
卫生统计学第八版李晓松第十章基于秩的非参数检验
第一节 配对样本的比较
(一)单样本数据的符号秩和检验
基本思想 1.假设样本所对应的总体中位数与给定的总体中位数相同,H0:M1 = M0。 2.计算样本中所有数值与给定中位数的差值,根据所有差值绝对值进行编 秩,得到正差值的秩和R+和负差值的秩和R-。
n(n +1) 3.若H0成立,理论上,R+与R-的总体均数应相等,等于: R ,总体 4 n(n 1)(2n 1) 标准差也应相等,等于: R 。 24 4.若R+与R-相差悬殊,均远离M0,则有理由拒绝H0 。具体通过R+ 或R- 的
第二节 两组独立样本的比较
(一)两组定量数据的比较
12岁男童与女童发样中Ca含量(μg/g)的比较 男童 Ca含量(1) 秩(2) 1843 18 383 4 406 5 334 1 443 6 676 11 771 13 358 3 607 9 484 7 n1=10 R1=77 女童 Ca含量(3) 秩(4) 842 14 336 2 742 12 1367 15 1623 16 597 8 1976 19 1818 17 643 10 4534 20 n2=10 R2=133
第一节 配对样本的比较
(二)配对样本数据的符号秩和检验
检验步骤
(1) 建立检验假设,确定检验水准 H0:差值的总体中位数等于0, Md = 0 H1:差值的总体中位数不等于0, Md ≠ 0
=0.05
(2) 求差值、编秩、求秩和
首先计算每对数据的差值,并对差值进行编秩。分别计算正、负差
值的秩和,得出 R+与R- ,如表所示。
第二节 两组独立样本的比较
(一)两组定量数据的比较
基本思想
人卫第七版医学统计学课后答案及解析-李康、贺佳主编
人卫第七版医学统计学课后答案李康、贺佳主编第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D11、E 12、C 13、E 14、A 15、C二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 11、D 12、E 13、E 14、C 15、E二、计算与分析第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A11、E 12、C 13、C 14、B 15、A二、计算与分析2[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
第十讲 非参数检验
分析完全随机设计的多样本计量资料时,若多样本观察指标不满足正态性和方差齐性, 不能进行方差分析, 以及多样本观察指标为等级 (有序分类) 资料, 宜采用 Kruskal-Wallis H 秩和检验。
14
第二节秩和检验 —完全随机设计多样本的秩和检验
【例11-4】某医生在研究再生障碍性贫血时, 测得不同程度再生障碍性贫血患者血清中可溶 性CD8抗原水平(U/ml),结果见表11-5,问不 同程度再生障碍性贫血患者血清中可溶性CD8抗 原水平有无差别?
通常规定,当 n1 n2 时,取较小样本的秩和作为检验统计量 T ;当 n1 n2 时,取秩和 较小者作为检验统计量 T 。
9
第二节秩和检验 —成组设计资料的秩和检验
【例11-2】某医院某医生对28例糖尿病早期微血管病 变的患者,按年龄、性别、病程、中医证候评分、生存 质量量表评分、饮食控制等情况,随机分为两组,试验 组采用西药加中药联合治疗方法,对照组采用西药加安 慰剂治疗方法,治疗4周,测定24小时尿蛋白改变量, 结果见表11-3,问该中药对糖尿病患者早期微血管病变 有无疗效?
16
第二节秩和检验 —完全随机设计多样本的秩和检验
【例11-5】探讨中药联合NB-UVB治疗寻常性银 屑病的临床疗效。95例患者分为3组,治疗组35 例给予NB-UVB照射,同时中药浴疗;对照1组33 例予NB-UVB照射,对照2组30例给予中药浴疗。 结果见表11-6,试比较三组疗效是否有差异?
4
第一节 非参数检验简述
表 11-1 参数检验与非参数检验的区别 非参数检验 推断总体分布,如中位数是否相等,是 否符合某种分布 参数检验 推断总体的参数,如算数均数、方 差、率是否相等 已知总体分布:如正态分布、二项 分布、poission 分布
非参数检验方法-秩和检验
u
T
n1N 1/ 2 0.5 n1n2 N 1/12
相同秩次出现,使u值偏小,故在相同秩 次较多(如超过25)时,应进行校正。
uc
T n1N 1/ 2 0.5
n1n2
(N 3 N
12N (N 1)
t
3 j
tj
)
t j表 示 相 同 秩 次 的 个 数
多组资料的比较
H 检验(Kruskal-Wallis法)是
d 48.54 -17.13 43.40 13.71 4.76 78.25 71.94 45.20
秩次
1.建立假设
–H0:差值的总体中位数M=0 –H1:差值的总体中位数M≠0 –α=0.05
2.计算统计量T值
–T=T-=3
3.查表及下结论
–当n=8时,T0.05(8)=3-33,p≤0.05,按 照α=0.05的水准,拒绝H0,接受H1,认为白 斑部位与正常部位的白介素有差异
非参数检验方法 (nonparametric test)
秩和检验
适用资料
1.总体分布为偏态或分布形式未知 2.等级资料 3.个别数据偏大或数据的某一端无确定的
数值 4.各总体方差不齐
非参数检验优点:不受总体分布的限 定,适用范围广
非参数检验缺点:符合作参数检验的 资料(如两样本均数比较的t检验), 如用非参数检验,检验效率低于参 数检验。一般犯第二类错误的概率 β比参数检验大
近似正态法
T nn 1 0.5
u
4
n n
12n
1
t
3 j
tj
24
48
91 2323 1 0.5
4
2323 12 23 1 103
医学统计学-非参数检验秩和检验
正态近似法 当n>50,可采用正态近似法,计
算u值。
T -n(n+1)/4-0.5 u=
n(n+1)(2n+1)/24
正态近似法
若相同秩次较多,应作校正计算。
T-n(n+1)/4-0.5
检验
诊断试验ROC曲线分析
配对设计差值比较的符号秩和检验 由Wilcoxon1945年提出,又称 Wilcoxon符号秩和检验,常用于检验 差值的总体中位数是否等于零。
分析步骤:
(1)建立检验假设,确定检验水准 Ho:差值总体中位数Md=0 H1:差值总体中位数Md≠0 α=0.05
(2)编秩:
依赖于特定分布类 型,比较的是参数
不受分布类型的影响,比 较的是总体分布位置
优点:方法简便、易学易用,易于推广使用、 应用范围广;可用于参数检验难以处理的资料 (如等级资料,或含数值“>50mg”等 )
缺点:方法比较粗糙,对于符合参数检验条件者,采用 非参数检验会损失部分信息,其检验效能较低;样本含 量较大时,两者结论常相同
例2 9名 肺炎病人的治疗结果:
疗效
治愈 治愈 死亡 无效 治愈 有效 治愈 有效 无效
秩次
12 9 7 3 5 4 6 8
平均秩次 2.5 2.5 9 7.5 2.5 5.5 2.5 5.5 7.5
SPSS中的菜单位置
基于秩次的非参数检验
• 两个独立样本比较的非参数检验 • 多个独立样本比较的非参数检验 • 配对样本比较的非参数检验 • 随机区组设计多个样本比较的非参数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n2=7
T2=134
Kruskal-Wallis test
(1) 建立假设检验
H0:四组鼠脾DNA含量的总体分布相同
H1:四组鼠脾DNA含量的总体分布位置不全相同 α=0.05
(2) 计算统计量
‣ 四个样本总例数N=8+7+9+8=32。将四样本32个观
察值统一由小到大编秩,见上表第(2)、(4)、(6)、 (8)列。在不同组中有相同含量值10.3两个,12.3三 个,均取各自的平均秩次。
Kruskal-Wallis test
Ti 2 12 H 3( N 1) N ( N 1) ni 1262 1342 123.5 2 54.5 2 12 3( 32 1) 19.90 32( 32 1) 8 7 9 8
Wilcoxon rank sum test
(3) 查表及结论
‣ n=n2-n1,查T界值表T0.05(4)=91~159,
两组患者的平均生存时间不同。
T1=162
落在界值范围外,所以P<0.05,拒绝H0,认为
二、正态近似法
例10-3 44例健康人与24例慢性气管炎病人痰液嗜酸 性粒细胞数的测量值(×106/L),问健康人与慢性 气管炎病人痰液嗜酸性粒细胞数有无显著差别?
0
计量 T 与总体的平均秩和应该相差不大;当与平均
秩相差太大时,超过了抽样误差可以解释的范围,
则 有 理 由 怀 疑 原 假 设 的 正 确 性 , 从 而 拒 绝 H0 。
(刘启贵)
的血清抗体滴度水平间差异是否有统计学意义?
抗体 滴度 (1) 1:10 1:20 1:40 1:80 1:160 1:320 合计 气 雾 组 皮下注 80亿 100亿 射组 (2) (3) (4) 2 15 10 5 1 — 33 4 7 12 7 2 — 32 2 1 13 9 5 1 31 累计 平均 秩次 (6) 4.5 20 49 77 91.5 96 秩 80亿 (7) 9 300 490 385 91.5 — 1275.5 100亿 (8) 18 140 588 539 183 — 1468 和 皮下 (9) 9 20 637 693 475.5 96 1912.5 和
Wilcoxon rank sum test
(1) 建立假设
H0: 两总体分布相同
H1: 两总体分布不同
=0.05
(2) 计算检验统计量:取较小样本的秩和作为检验 统计量T,T=560.5,
1 T1 n 1( N 1 ) 0.5 2 z 3.62 n1 .n2 ( N 3 N ( t 3 t ) ) 12 N( N 1 )
界值范围内,P >0.05,不拒绝H0,认为指导后 牙周状况无显著好转。
适用条件:
‣
完全随机设计的两个样本比较,若不满足参数 检验的应用条件,则用本法;另外,适合两个 等级资料比较。
Wilcoxon rank sum test 一、查表法
两组患者生存时间(月)
例题10-3 对无淋 巴细胞转移与有 淋巴细胞转移的
(3) 查表及结论
2 2 ‣ 现k=4,ν=k-1=4-1=3,查 界值表, 0.05,3 =7.81
2 2 =19.90> 0.05 ,3 =7.81 ;故P<0.05,拒绝H0,接受
H1,故可认为四组DNA含量有差别。
例10-6 下表第(1)~(4)列为霍乱菌苗不同途径免 疫21天后血清抗体滴度水平测定结果,问各组间
Wilcoxon rank sum test
(3) 查表与结论 z0.05=1.96,z> z0.05,,P<0.05,拒绝H0,认为
总体分布不同,即健康人与气管炎病人的痰液
嗜酸性粒细胞数有差别。
Frank Wilcoxon
适用条件:
(1) 不满参数检验的应用条件的完全随机设计的多
个样本比较;
(2) 多个等级资料比较。
冠以原d 的正负号,再分别求正负秩和,得到T+
=33,T- =3,取秩和较小者作为检验统计量T=3;
(3)查表 T0.05(8) 3 ~ 33 ,差异显著。
例10-2 对28名患有轻度牙周疾病的成年人,指导他们
实行良好达到口腔卫生习惯, 6个月后,牙周情况好 转程度依高到低给予分数+3,+2,+1;牙周情况变差 程度依次给予分数-1,-2,-3;没有变化给予0分,试 对该项指导结果进行评价。
Kruskal-Wallis test
Ti 2 12 H 3( N 1) N ( N 1) ni 12 1275 .5 2 14682 19122 ( ) 3(96 1) 11.36 96(96 1) 33 32 31
由于各组相同例数较多,故用公式(10-6)校正
Hc=12.27> 02.01,2 =9.21,P<0.01三组血清抗体
滴度水平的差别有统计学意义。
William Kruskal
1.基于秩次比较的非参数检验,适用于:①总体 分布类型未知或非正态分布数据;②有序或半定
量资料;③数据两端无确定的数值。
2.非参数检验方法的优点是适用范围广,当数据
满足参数检验条件时,应首选参数检验,否则检
z
例10-1
临床某医生研究ቤተ መጻሕፍቲ ባይዱ癜风病人的白介素
IL-6水平(u/ml)在白斑部位与正常部位有无差 异,调查资料如下表
Wilcoxon signed rank test
(1) 建立检验假设,确定检验水准
H0:差值的总体中位数=0 H1:差值的总体中位数0 =0.05 (2) 计算统计量
计算差值d,再按由小到大的顺序编秩次,并
验效能降低;当数据不满足参数检验的条件时, 选择非参数检验方法更为合适。
3.非参数检验方法有多种,如配对比较的Wilcoxon符 号秩和检验、两组比较的Wilcoxon秩和检验 、多组 比较的Kruskal-Wallis秩和检验等,其中最常用的是
Wilcoxon秩和检验。
4. Wilcoxon秩和检验的思想:如果 H 成立,秩和统
胃癌患者,观察
其生存时间,问 两组患者的生存 时间是否不同?
Wilcoxon rank sum test
(1) 建立检验假设,确定检验水准 H0: 两总体分布相同
H1: 两总体分布不同
=0.05
(2) 计算统计量
‣
将两个样本24个数据由小到大的顺序统一编次,数 值相等时取平均秩次,求两组秩和 T1+T2=162+138=300,用N(N+1)/2=24(24+1)/2=300 进行核对,计算无误,以样本含量较小组的秩和作 为检验统计量T,T1=162。
(5)
8 31 66 87 95 96 —
Kruskal-Wallis test
(1) 建立假设检验 H0: 三组血清抗体滴度水平的总体分布相同;
H1: 三组血清抗体滴度水平的总体分布不全相 同
α=0.05 (2) 计算统计量 本例作多组秩和检验,第(6)列是各滴度的平 均秩次。以各组的例数乘平均秩号,即得第(7)~ (9)列滴度的各组秩和。
界值内,P >0.05;当n>25时,可用正态近似法计
算z值进行z检验,当相同秩次较多时z值需进行校
正。
z T n n 1 / 4 0.5 n(n 1)(2n 1) / 24
T n n 1 / 4 0.5
3 n(n 1)(2n 1) (ti ti ) 24 48
计算步骤:
Wilcoxon signed rank test
(1) 建立检验假设,确定检验水准 H0: 差值总体中位数为0 H1: 差值总体中位数不为0 α=0.05 (2) 计算统计量
Wilcoxon signed rank test
(3) 查表与结论
查T界值表,T0.05(23)=73~203,T=91,在
例10-5 研究白血病时测定四组鼠脾DNA的含量,
结果列于下表,试分析各组DNA含量有无差别?
表10-6 各组鼠脾DNA含量(mg)的秩和计算
正 常 脾 含量 (1) 12.3 13.2 13.7 15.2 15.8 16.9 17.3 17.4 n1=8 秩次 (2) 18 22 26 28 29 30 31 32 T1=216 患自发性白血病的 脾 含量 (3) 10.8 11.6 12.3 12.7 13.5 13.5 14.8 秩次 (4) 8 13 18 21 23 24 27 患移植白血病的脾 (甲组) 含量 (5) 9.3 10.3 11.1 11.7 11.7 12.0 12.3 12.4 13.6 n3=9 秩次 (6) 1 3.5 11 14 15 16 18 20 25 T3=123 患移植白血病的脾 (乙组) 含量 (7) 9.5 10.3 10.5 10.5 10.5 10.9 11.0 11.5 n4=8 秩次 (8) 2 3.5 5 6 7 9 10 12 T4=54.5
11.36 Hc 12.27 3 3 3 3 3 8 8 23 23 35 35 21 21 8 8 1 963 96
Kruskal-Wallis test
(3) 查表及结论 2 2 =k-1=3-1=2, 0 ‣ 查 界值表, .01,2 =9.21, 现
Wilcoxon signed rank test
(4) 将秩次冠以正负号,计算正、负秩和(T+, T-)
T++T- =n(n+1)/2
(5) 用不为“0”的对子数n及T(取绝对值小的 秩和作为统计量T)查检验界值表,得到P值 作出判断。