第十章 基于秩次的非参数检验(本)_PPT幻灯片

合集下载

医学统计学 -第10章 基于秩次的非参数检验

医学统计学  -第10章 基于秩次的非参数检验
Kruskal-Wallis H检验,用于推断计量资料或等级资料的 多个独立样本所来自的多个总体分布是否有差别。
H0:多个总体分布相同(或者中位数相等) H1:多个总体分布不同或不全相同(或者中位数不全相等)
26
例10.5
某医院用3种方法治疗15例胰腺癌患者,每种方 法各治疗5例,治疗后生存月数如下表,问3种方法的 疗效有无差别?
当n≤50时,通过查T界值表来确定是否波动过

T在界值范围内,波动不大
P>α
T在界值范围外或等于界值时,波动大,P≤α
11
(4) 查表及推断结论 查T界值表T0.05(16)=29~107 由于T=28在上下界值范围外,所以P≤0.05。 按a=0.05检验水准拒绝H0,接受H1,可以 认为该厂工人尿铅含量不当地正常人有差异, 通过正负秩和的大小可以推断工人的尿铅含 量要高于正常人。
第十章 基于秩次的非参数检验
1
假设检验的方法分为两类
参数检验(parametric test)
已知总体分布类型,对未知参数(μ、π)进行统计推断 依赖于特定分布类型,比较的是参数 一般有严格的适用条件
如:样本来自正态分布、总体方差齐同等 这类方法比如:t检验、F检验等
非参数检验(nonparametric test)
Z
T n1(N 1) / 2 0.5
n1n2 (N 3 N
12N(N 1)
(t
3 j
t
j
))
2036 40(84 1) / 2 0.5
40 44 (843 84 (323 32) (323 32) (203 20)) 12 40 (84 1)
7.01
由于Z=7.01,大于Z0.05=1.96,所以P<0.05,按照α=0.05 检验水准拒绝H0,接受H1,可以认为夏冬两季居民体 内核黄素含量有差别。根据平均秩次可以知道夏季的含

非参数检验 PPT课件

非参数检验 PPT课件
如果此假定不成立或不能确定是否成立, 就应采用秩和检验来分析两样本是否来自同 一总体。
例9.3 对无淋巴细胞转移与有淋巴细胞转移的胃癌患者,观察其 生存时间,问两组患者的生存时间是否不同?
基本思想
混合编秩 分别计算两组的秩和 假定H0成立 任一组秩和不应太大或太小 与平均理论秩和 N(N+1)/4 应相差不大
思考:单样本计量资料当数据不满足正 态性时如何去分析?
例9.2 对28名有轻度牙周疾病的成年人,指导他们实行良好的 口腔卫生习惯,6个月后,牙周情况好转程度依高到低给予分 数+3,+2,+1;牙周情况变差程度依次给予分数-1,-2,-3,没有 变化的给予0分,请对此项指导结果进行评价。
T0.05(23)=73-203
非参数检验 PPT课件
▪ 单样本t检验(正态分布) ▪ 配对样本t检验(差值满足正态分布) ▪ 两独立样本t检验(正态分布、方差齐性) ▪ 完全随机设计方差分析(正态分布、方差齐性) ▪ 随机区组设计方差分析(正态分布) ▪ 等级资料
当上述统计方法所对应的条件不满足,该如何对数据做分析?
非参数检验适用的资料
=0.05。
编秩:混合编序.先在各组内从小到大排队,再将几组统 一编秩:同组相同数据,秩次顺列;不同组相同数据,取 平均秩次。 求秩和:R1,R2、R3、R4 ……
下结论: 当处理组数小于等于3组时,且各组例数小于等于5.查附表 11,确定P值.
当 n 较大时,计算统计量H值, H 近似服从 = k – 1 的 2 分布。故可按 2 分布获得概率 P,作出统计推
本例秩和T1=162,T2=138。
查表 T0.05n1n249 115,取9较小样本量者为统计量, T=162,恰好落在界点外,所以P<0.05,按0.05水准, 拒绝H0,即两组患者的平均生存时间不同。

第十章基于秩次的非参数检验课件

第十章基于秩次的非参数检验课件

缺点:方法比较粗糙,对于符合参数检验条件者,采用
非参数检验会损失部分信息,其检验效能较低;样本含
2020/9/24量较大时,两者结论常相同
10
一、非参数统计的概念
秩次:观察值由小到大排列后得到的秩序号, 当几个数据大小相同时,取平均秩次作 为其秩次。
秩和:用秩次代替原始数据求和得到。 秩和检验:用秩和进行假设检验的方法。
(甲,乙,丙,丁,戊)(很好,好,一般,差)
2020/9/24
等级资料?
2
以下资料如何进行统计推断呢?
•不服从正态分布的资 料 •多组资料满足正态分 布但方差不齐 •等级资料
2020/9/24
非参数检验方法!
3
第十章 基于秩次的非参数检验
nonparametric test
第十章 基于秩次的非参数检验
2020/9/24
11
本章介绍的非参数统计方法 均基于秩次
秩次(rank)——将数值变量值从小到大,或等级变量值从弱到
强所排列的序号。
例1 11只大鼠存活天数:
存活天数4,10,7,50,3,15,2,9,13,>60,>60
秩次 3 6 4 9 2 8 1 5 7 10 11
秩次相同(tie)取平均秩次!!
10.5 10.5
例2 7名 肺炎病人的治疗结果: 危险程度 治愈 治愈 死亡 无效 治愈 有效 治愈
秩次 1 2 7 6 3 5 4 平均秩次 2.5 2.5 7 6 2.5 5 2.5
2020/9/24
12
二、配对设计和单样本资料的符号秩和检验
(一)、 配对设计资料的符号秩和检验
例10-1 某研究者欲研究保健食品对小鼠抗疲劳作用,将同 种属的小鼠按性别和年龄相同、体重相近配成对子,共10 对,并将每对中的两只小鼠随机分到保健食品两个不同的 剂量组,过一定时期将小鼠杀死,测得其肝糖原含量 (mg/100g),结果见表10-1, 问不同剂量组的小鼠肝糖 原含量有无差别?

基于秩次的非参数检验PPT课件

基于秩次的非参数检验PPT课件

表10-4 某地居民夏冬两个季节体内核黄素营养状况比较
核黄素 营养状况
例数
夏季
冬季
合计 累积频数 秩次范围 平均秩次
缺乏
10
22
32
32
1~32
16.5
不足
14
18
32
64
33~64 48.5
适宜
16
4
20
84
65~84 74.5
合计
40
44
84


n140 T11.5 61 04.5 81 47.5 41 62036
绝对值|d| 1.88 1.72 0.37 0.02 0.04 0.18 0.23 0.51 0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
秩次 12 10 5 1 2 3 4 6 7 8 9 12 12 14 15 16
分配符号 -12 -10 -5 -1 2 3 4 6 7 8 9 12 12 14 15 16
9
3
14.9
13.5
1.4
3
3
4
30.2
27.6
2.6
8
8
5
8.4
9.1
-0.7
1.5
-1.5
6
7.7
7.0
0.7
1.5
1.5
7
16.4
14.7
1.7
5
5
8
19.5
17.2
2.3
6
6
9
127.0
155.0
-28.0
10
-10
10
18.7
16.3

卫生统计学第八版李晓松第十章基于秩的非参数检验

卫生统计学第八版李晓松第十章基于秩的非参数检验

第一节 配对样本的比较
(一)单样本数据的符号秩和检验
基本思想 1.假设样本所对应的总体中位数与给定的总体中位数相同,H0:M1 = M0。 2.计算样本中所有数值与给定中位数的差值,根据所有差值绝对值进行编 秩,得到正差值的秩和R+和负差值的秩和R-。
n(n +1) 3.若H0成立,理论上,R+与R-的总体均数应相等,等于: R ,总体 4 n(n 1)(2n 1) 标准差也应相等,等于: R 。 24 4.若R+与R-相差悬殊,均远离M0,则有理由拒绝H0 。具体通过R+ 或R- 的
第二节 两组独立样本的比较
(一)两组定量数据的比较
12岁男童与女童发样中Ca含量(μg/g)的比较 男童 Ca含量(1) 秩(2) 1843 18 383 4 406 5 334 1 443 6 676 11 771 13 358 3 607 9 484 7 n1=10 R1=77 女童 Ca含量(3) 秩(4) 842 14 336 2 742 12 1367 15 1623 16 597 8 1976 19 1818 17 643 10 4534 20 n2=10 R2=133
第一节 配对样本的比较
(二)配对样本数据的符号秩和检验
检验步骤
(1) 建立检验假设,确定检验水准 H0:差值的总体中位数等于0, Md = 0 H1:差值的总体中位数不等于0, Md ≠ 0
=0.05
(2) 求差值、编秩、求秩和
首先计算每对数据的差值,并对差值进行编秩。分别计算正、负差
值的秩和,得出 R+与R- ,如表所示。
第二节 两组独立样本的比较
(一)两组定量数据的比较
基本思想

第十章基于秩次的非参数检验

第十章基于秩次的非参数检验

53-99
55-105

47-97
49-103
51-109
45-99
47-105
49-111




说明
• 如果n1或n2-n1超出了T界值表的范围, 可用正态近似检验。
正态近似法
当n1>10或(n2-n1)>10时
连续性校正
Z T n1 (n1 n2 1) 2 0.5
n1n2 (n出1 现n2相1同) 1的2 数据 若Z值超过标准正态分布的临界值,则拒绝 H0;若出现相持较多,则用下式进行校正
秩次
8
7
6
0.3
1
2.2
6
3.5
9
10
n2=8
表1 高中生与大学生的每周平均上网时间比较(小时/周)
高中生
上网时间
秩次
0.5
2 2.5
3
1
4
0.5
3 2.5
11
1.5
5
2.5
7
3.5
n1=8
大学生
上网时间
秩次
8
7
6
0.3
1
2.2
6
3.5
9
10
n2=8
表1 高中生与大学生的每周平均上网时间比较(小时/周)
α=0.05
秩和检验的步骤
2. 编秩
3.
将两组数据由小到大统一编秩,编
秩时如遇有相同数据,取平均秩次。
4. 3. 求秩和
5.
两组秩次分别相加。
6. 4. 确定统计量
7.
若两组例数相等,则任取一组的秩
和为统计量,若两组例数不等,则以样本

医学统计学(课件)基于秩次的非参数检验

医学统计学(课件)基于秩次的非参数检验

缺点:方法比较粗糙,对于符合参数检验条件者,采用 非参数检验会损失部分信息,其检验效能较低;样本含 量较大时,两者结论常相同
本章内容
配对设计和单样本资料的符号秩和检验 完全随机设计两组独立样本的秩和检验 完全随机设计多组独立样本的秩和检验
秩次与秩和
秩次(rank),秩统计量 是指全部观察值按某种顺序排列的位序。一般
对于分布不知是否正态的小样本资料,为保险起见,宜选 用非参数检验
对于一端或两端是不确定数值(如<0.5、>0.5等)的资料, 不管是否正态分布,只能选用非参数检验
对于等级资料,若选行×列表资料的卡方检验,只能推断 构成比差别,而选用非参数检验,可推断等级强度差别
参数检验
(parametric test)
秩和检验的目的是推断两个总体分布的位置是否有差 别,而不关心其分布的形状有无差别
两个总体分布位置不同,实际情况一般是两个总体分 布形状相同或类似,这时可简化为两个总体中位数不 等
一、两组连续变量资料的秩和检验
如果资料方差相等,且服从正态分布,就可以 用t检验比较两样本均数
如果此假定不成立或不能确定是否成立,就应 采用秩和检验来推断两样本分别代表的总体分 布是否不同
11.5 11(111) / 4 0.5
u
1.91
11(111)(2 111) (23 2)
24
48
u <1.96, 故P>0.05,在 0.05 水准上接受H0,拒绝H1, 结论与查表法相同。
注意
符号秩检验若用于配对的等级资料,则先把等 级从弱到强转换成秩(1,2,3,…);然后求各对 秩的差值,省略所有差值为0的对子数,令余下的有 效对子数为n;最后按n个差值编正秩和负秩,求正 秩和或负秩和。但对于等级资料,相同秩多,小样 本的检验结果会存在偏性,最好用大样本。

SPSS非参数检验秩和检验ppt课件

SPSS非参数检验秩和检验ppt课件
数据文件
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
(二)分析数据
Analyze →
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
结果分析
描述:甲法的平均秩次为9.56,秩和为76.50; 乙法的平均秩次为4.75,秩和为28.50;
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
• K-Independent-Samples Tests :成组设计的 多个样本均数比较的非参数检验,此处不提 供两两比较方法。
• 2-Related-Samples Tests:配对设计两样本 均数的非参数检验。
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去
频数表数据比较的秩和检验
• 例4 某医院用三种复方小叶枇杷治疗 老年慢性支气管炎,试比较其疗效有无差异。
表4 三种复方小叶枇杷治疗老年性慢性支气管炎疗效比较
疗效 等级 控制 显效 好转 无效 合计
火灾袭来时要迅速疏散逃生,不可蜂 拥而出 或留恋 财物, 要当机 立断, 披上浸 湿的衣 服或裹 上湿毛 毯、湿 被褥勇 敢地冲 出去

基于秩次的非参数检验PPT课件

基于秩次的非参数检验PPT课件
差值经正态性检验得W=0.4561,P= 0.0001, 差值中存在极端值
18
编辑版ppt
表10-2 两法测定11份工业污水中氟离子浓度结果比较
样品号
氟离子浓度
差值d 差值秩次 分配符号
(1)
电极法(2) 分光光度法(3) (4)=(2)-(3)
1
10.5
8.8
1.7
4
4
2
21.6
18.8
2.8
9
基于秩次的非参数检验
1
编辑版ppt
基于秩次的非参数检验
单样本和配对设计资料的符号秩和检验 两组独立样本比较的秩和检验 多组独立样本比较的秩和检验 随机区组设计多组比较的秩和检验 案例讨论
2
编辑版ppt
非参数检验
假设检验方法分为参数检验和非参数检验 参数检验
以特定的总体分布为前提,对未知的总体参数做推 断
5
编辑版ppt
非参数检验
满足参数检验的资料采用非参数检验,会损失 数据信息,降低检验效能
秩和检验
常用的且检验效能较高的非参数检验方法 较完备的大样本抽样分布理论基础。 以秩和为检验统计量
6
编辑版ppt
单样本和配对设计资料的符号秩和检验
Wilcoxon符号秩和检验
推断总体中位数是否等于某个指定值(常数) 可用于单样本设计或配对设计,定量资料不满足参
查表法
根据n和T查附表9(配对比较的符号秩和检验) 若T值在上、下界值内,P值大于相应的概率; 若T值等于上、下界值,P值等于相应概率; 若T值在上、下界值范围外,P值小于相应的概率。 本例:n=16,T=108或28,查表得0.01<P<0.025
13
编辑版ppt
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(二)正态近似法
若n>25,超出T界值表的范围,可用正态 近似法作Z检验:
T nn 1 4
T n(n 1)(2n 1)/ 24
Z T T T nn 1 4 0.5
T
n(n 1)(2n 1)/ 24
式中0.5为连续性校正数。
如果相同秩次较多(不包括差值为0 者),应计算校正的Zc。
T nn1 4 0.5
0
77
65
-12
-10
91
90
-1
-1.5
70
65
-5
-5.5
71
80
9
9
88
81
-7
-8
87
72
-15
-11
T+=24.5, T-=41.5
H0:Md=0 (M1=M2) H1:Md≠0 (M1≠M2) α=0.05 求各对子的差值d; 编秩:按差值绝对值大小编秩并加上正负号,差值的绝对值
相同时取平均秩次;
治疗后 4.2 5.5 6.3 3.8 4.4 4.0 5.9 8.0 5.0
差值(d)
秩次
1.8
6.5
-0.7
-4.5
-1.8
-6.5
-0.4
-3
2.6
8
-0.2
-2
0.1
1
-4.5
-9
-0.7
-4.5
T+=15.5, T-=29.5
(二)方法步骤
H0:Md=0 H1:Md≠0
α=0.05
求各对子的差值d;
H0:Md=0 (即M=2.15) H1:Md>0 (即M>2.15) 单侧α=0.05
求差值:d=X-2.15;
编秩:按差值绝对值大小编秩并加上正负号,差值 的绝对值相同时取平均秩次;
求秩和并验算: T ++ T -=n(n+1)/2;
确定统计量T: 任取T +或 T –作为检验统计量;
查T界值表,确定P值:本例T超出单侧α=0.005 的T 界值范围,故P<0.005;
无论样本资料所来自的总体分布形式如何,甚 至是未知的,都能适用;
• 对数据要求不严,对某些指标不便准确测定,
只能以严重程度、优劣等级、先后次序等做记 录的资料也可以应用;
• 多数非参数统计方法简便,易于理解和掌握。
概述
本章介绍非参数检验中方法比较成熟且 检验效能较高的秩和检验。内容包括:
◊ 单样本和配对设计资料的符号秩和检验 ◊ 两组独立样本比较的秩和检验 ◊ 多组独立样本比较的秩和检验
表7-2 12名工人尿氟含量测定结果
尿氟含量(mmol/L)
差值(d=X-2.15)
秩次
2.15
0
2.10
-0.05
-2.5
2.20
0.05
2.5
2.12
-0.03
-1
2.42
0.27
4
2.52
0.37
ห้องสมุดไป่ตู้
5
2.62
0.47
6
2.72
0.57
7
2.99
0.84
8
3.19
1.04
9
3.37
1.22
10
4.57
概述
非参数统计则不依赖于总体的分布 类型,应用时可以不考虑被研究的对象 为何种分布以及分布是否已知,由于该 种假设检验方法并不是参数间的比较, 而是用于分布之间的比较,故称为非参 数检验(nonparametric test)。
概述
非参数统计方法检验的主要优点:
• 适用范围广。对变量的类型和分布无特殊要求,
概述
• 一般统计检验方法,都要求样本来自的总体分布 类型(如正态分布、t分布)是已知的,在此条件 下(或在这种假设的基础上)对总体参数进行估 计或假设检验,故称为参数统计(parametric statistics)。
• 但是在实际工作中,有时对总体的分布类型不易 判断,或服从正态分布。若不知道所研究样本来 自总体的分布类型或已知总体分布与检验需要的 条件不符,此时就必须使用非参数统计 (nonparametric statistics) 。
2.42
11
T+=62.5, T-=3.5
一、单样本资料的符号秩和检验
本法的基本思想
检验假设H0 是差值的总体中位数等于0,备选假设H1 是差值的中位数不等于0。如果该工厂工人尿氟与当地正常 人无差别,即总体中位数相同,则各检测值与中位数之差 值应服从于以0 为中心的对称分布;也就是相当于把这些 差值按其绝对值的大小编秩并标上原来的正、负号后,正 的秩和与负的秩和在理论上应该是相等的或相差不大。即 使有一些差别,也只能是一些随机因素造成的差别。所以 如果差别不大就不拒绝H0,如果差别很大就拒绝H0。
Zc n(n1)(2n1)
t3j t j
24
48
式中t j为第j个相同秩次的个数。
对子号 1 2 3 4 5 6 7 8 9 10 11 12
例 12对双胞胎兄弟智力测试得分
先出生者 后出生者
差值(d)
秩次
86
88
2
3
71
77
6
7
77
76
-1
-1.5
68
64
-4
-4
91
96
5
5.5
72
72
作出结论:可以认为该厂工人尿氟含量高于当地正 常人。
二、配对设计资料的符号秩和检验
例7.1 某医院对9名苯中毒患者 试用抗苯一号治疗,得白细胞总数 见下表,问该药是否对患者的白细 胞总数有影响?
表7-1 9名苯中毒患者治疗前后白细胞总数(109/L)
病人号 1 2 3 4 5 6 7 8 9
治疗前 6.0 4.8 4.5 3.4 7.0 3.8 6.0 3.5 5.0
编秩:按差值绝对值大小编秩并加上正负号,差值 的绝对值相同时取平均秩次;
求秩和并验算: T ++ T -=n(n+1)/2;
确定统计量T: 任取T +或 T –作为检验统计量;
查T界值表,确定P值:本例T 在双侧α=0.10 的T 界 值范围内,故P>0.10;
作出结论:尚不能认为治疗前后白细胞总数有差别。
求秩和并验算: T ++ T -=n(n+1)/2;
确定统计量T: 任取T +或 T –作为检验统计量;
查T界值表,确定P值:本例T 在双侧α=0.10 的T 界值范围 内,故P>0.10;
结论:尚不能认为双胞胎兄弟出生先后对智力有影响。
本例若采用正态近似法,因相同秩次 较多,应计算校正的Zc。
第一节 单样本和配对设计资料的符 号秩和检验
Wilcoxon 符号秩和检验(wilcoxon 配对法或wilcoxon signed rank test )是 推断其差值是否来自中位数为零的总体 方法,可用于配对设计差值的比较和单 一样本与总体中位数的比较。
一、单样本资料的符号秩和检验
例7.2 已知某地正常人尿氟含量的中位数 为2.15mmol/L。今在该地某工厂随机抽 取12名工人,测得尿氟含量见表7-2,问 该厂工人的尿氟含量是否高于当地正常 人?
相关文档
最新文档