第九讲-2 非参数检验-差异显著性检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(方差不齐)的计量资料. 2.分布未知的计量资料 3.一端或两端为无确切值的资料,如,只是>某
值或<某值。 4.等级资料,当比较的数据只能用严重程度、
优劣等级的半定量(等级)资料组间的比较。
非参数检验—秩和检验
秩和非参数检验是推断一个总体表达分布位置的 中位数M和已知M0、两个或多个总体的分布是否 有差别。该检验先将数值变量资料从小到大, 或等级资料从弱到强转换成秩,再计算检验统 计量。特点是假设检验的结果对总体分布的形 状差别不敏感,只对总体分布的位置差别敏感。
2)选择两个检验变量(对)进入Test Variable list
3)选择检验方法。
SPSS提供三种检验方法(Test Type)。
Wilcoxon test(Wilcoxon Signed-Rank test)威尔科克森符号 秩检验:不但考虑关于两个符号的差异,且考虑成对间差异的 数量。比符号检验更有效。用于配对样本非参检验。
T界值表(配对比较的符号秩和检验用)
N
单侧:0.05 双侧:0.10
单侧:0.025 单侧:0.01 单侧:0.005 双侧:0.05 双侧:0.02 双侧:0.010
5 0--15
6 2--19
0--21
7 3--25
2--26
0--28
8 5--31
3--33
1--35
0-36
9 8--37
5--40
怎样选用不同设计的秩和检验方法
1)首先要区分试验设计和资料的类型: 2)若是一个样本资料或者配对设计的资料, 来自
非正态总体或总体分布无法确定,可选用 wilcoxon符号秩和检验方法; 3)若是两组独立样本资料,来自非正态分布的定 量资料或有序二分类变量资料(等级资料)宜用 wilcoxon秩和检验;
单个样本的Wilcoxon符号秩和检验
• 单个样本中位数和总体中位数比较,目的 是推断样本所来自的总体中位数M与某个已 知的中位数M0是否有差别。
• 用样本各变量与M0的差值,即推断差值的 总体中位数和0是否有差别。
• 已知某地正常人尿氟含量的中位数为 45.30µmol/L,今在该地某厂随机抽取12名 工人,测得尿氟含量如表所示。
秩和检验的方法----秩转换 秩和检验的基本计算步骤:
1.将数据(x)按大小转化为秩次(i),用秩 次的大小反映变量值的大小。
2.对各组”秩次”求和,称为秩和(T =∑i)。
3.对各组秩和(T)做检验的方法称为秩和检验。
例子:秩和计算
• 两组各有5个变量值。现在依从小到大的顺序将 它们排列起来,并标明秩次,结果如下:
3.33
PAES2法 - Positive Ranks 9(b)
7.56
PAES1法
Ties
0(c)
10.00 68.00
Total
12
a PAES2法 < PAES1法,变量PAES2法中变量值小于变量PAES1法的有3个 b PAES2法 > PAES1法,变量PAES2法中变量值大于变量PAES1法的有9个 c PAES2法 = PAES1法,变量PAES2法中变量值等于变量PAES1法的有0个
2.编秩号。
• (1)剔去差数为0的数据;
• (2)余下的n个差数按绝对值自小至大排秩号,但排 好后秩号要保持原差数的正负号,正负秩分开列;
• (3)差数绝对值相等(相同秩,ties)时,要以平均 秩表示,如差数绝对值为1.09者共2个,其秩号依次应 为1、2,现皆取平均秩号1.5。
3.求秩号和即将正、负秩号分别相加,分栏写,本例得正 秩号和为64.5,负秩号和为1.5。
4. 检验统计量R取较小一个秩号和,R=1.5,有效差值个数
n=11(差值0无效)根据R值查两配对样本T界值表,得
单侧P<0.005,按0.05水平拒绝H0,差异有统计学意义。 注意:查表时,在左侧找到对子数n,将检验统计量R 值与n右侧相邻栏内的界限值相比。
R在界限值内,则其P值大于表上端纵标目之概率水 平; R等于界限值,则其P值等于相应概率水平; R在界限值外,则P值小于相应概率水平,向右移动 一栏,再与界限值比较。
4)单击OK。
数据输入格式 输入过程
Asymptotic only 采用渐进方法计算确切 概率,默认检验方法
Monte Carto 采用蒙特卡洛模拟方法计 算确切概率
Exact Fisher 确切概率法
SPSS 输出结果 Ranks
N
Mean Rank
Sum of Ranks
Negative Ranks 3(a)
3
1
11
12
3
6
8
6
6
68 10
检验步骤
(1)正态性检验 (2)H0:差值总体中位数=0 (3)H1:差值总体中位数≠0,α=0.05 (4)计算检验统计量T值:
省略差值为0的对子数,得到余下对子数n=12 差值排秩,分别计算差值正秩、负秩之和 取较小秩号和,R=10 (5)查临界值表,R=10,n=12,双侧,得 0.01<P<0.05 差异有统计学意义。
• A组 3.5 5 8 9 10 /35.5
• B组 1 2 3.5 6 7 /19.5
• 总秩和:55.
• 上面A组和B组中各有五个原始值,按顺序排 列:最小值设为1,再按绝对值大小对余下的 变量逐个排序,最大值为两组变量个数之和 10。依次可得1,2,3.5,3.5,5,6,7,8,9,10。 这10 个序号即是秩次。A组秩和就是等于 3.5+5+8+9+10=39.5,B组秩和就是等于 1+2+3.5+6+7=19.5。从两组的原始变量值也 可以初步看出:A组偏大,B组偏小。现在得 出的秩和也是A组大于B组,与由变量值所观 察到的一致。
3--42
1-44
10 10--45
8--47
5--50
3-52
11 13--53
10--56
7--59
5-61
12 17--61
13--65
9--69
7-71
N=12,R=10,0.01<P<0.05,
注意:省略差值为0的对子数,来计算n
SPSS过程
1)Analyze-Nonparametric Tests-2 Related Samples
计算方法同单样本Wilcoxon符号秩检验
序 PAEs 1法 PAEs 2 法
差
号 (1)
(2) (2)-(1)
1
39
55
16
2
42
54
12
3
51
55
4
4
43
47
4
5
55
53
-2
6
45
63
18
7
22
52
30
8
48
44
-4
9
40
48
8
10
45
55
10
11
40
32
-8
12
49
57
8
合计
秩号
正
负
10
9
3
T界值表(配对比较的符号秩和检验用)
N
单侧:0.05 双侧:0.10
5 0--15
6 2--19
7 3--25
8 5--31
9 8--37
10 10--45
11 13--53
12 17--61
单侧:0.025 单侧:0.01 单侧:0.005 双侧:0.05 双侧:0.02 双侧:0.010
0--21
• 两个独立样本检验:2-Independent Samples Tests
• 多个独立样本检验:K Independent Samples Tests
• 两个相关样本检验:2-Related Samples • 多个相关样本检验:k-Related Samples
显著 性检 验
3.适用范围
适用范围广,适用范围: 1.数据分布为偏态分布或不满足参数检验方法
非参数检验
• 许多调查或实验所得的科研数据,常常具有如下特点: (1)资料的总体分布类型未知或无法确定; (2)资料分布类型已知,但不符合正态分布; (3)某些变量可能无法精确测量如等级资料。 (4)一端或两端为不确定数值的资料 这时做统计分析就不能使用参数检验,而是要采用非参
数检验:即不考虑总体分布类型是否已知,不比较总 体参数,只比较总体分布的位置是否相同的统计方法。
秩和检验概述
“秩”:按数据大小排定的次序号,又称秩次号。 编秩:将观察值按顺序由小到大排列,并用序号代替原始
变量值本身。 用秩次号代替原始数据后,所得某些秩次号之和,即按某
种顺序排列的序号之和,称为秩和,反映了一组数据在 分布上的范围位置。 基本思想: 基于秩次(通过编秩,用秩次代替原始数据信息来进行检 验)。 即检验各组的平均秩或秩和是否相等。如果经检验得各组 的平均秩和秩和不相等,则可以推论数据的分布不同。
67.37
22.07
71.05
25.75
87.37
42.07
-
正秩 负秩 1.5
1.5 3 4 5 6 7 8 9 10 11 64.5 1.5
检验步骤:
先进行正态分布与否的检验,确认不服从正态分布。用 Wilcoxon符号秩检验。
1.H0:尿含量中位数M=45.30,样本含量与正常值无差 异
• H1:M>45.30。 a=0.05
Sign test符号检验:对所有样品计算两个变量值间的差并将差值 分为正、负或结3类(秩)。如果两个变量有类似的分布,则 正、负数差异无显著不同。
McNemar检验:每个被试对象的反应被抽查两次,分别在指定事 件发生的前、后,McNemar检验确定初始的反应的比率,是 否等于最终反应的比率。该检验用来探究取决于试验干涉前、 后设计中反应的变化。用于配对计数资料差异检验。
4)若是多组独立样本资料,来自非正态总 体或方差不齐(转化后也不满足)的定量 资料或者是有序多分类变量资料(等级资 料)宜用Kruskal-Wallis秩和检验。
5)若是随机区组设计的自非正态总体或方 差不齐(转化后也不满足)的定量资料, 宜用Firedman秩和检验。
6)各种类型的秩和检验通常有查表法和正 态近似法两种计算方式,分别适用于不同 样本量的资料。在相同秩次的个数大于样 本量的25%时需要采用相应的公式进行校 正。
1.基本概念
•参数检验(parametric test):假定比较数据服从某 分布,通过参数的估计量对比较总体的参数(μ)作检 验,称参数法检验。如t检验、方差分析。
•非参数检验(Nonparametric test)是指在总体分 布情况不明时,用来检验数据资料是否来自同一 个总体假设的一类检验方法。
12名工人的尿氟含量(µmol/L)
序号 1 2 3 4 5 6 7 8 9 10 11 12 合计
尿氟含量(1) 差值d=(1)-45.30
44.21
-1.09
45.30
0
Baidu Nhomakorabea
46.39
1.09
49.47
4.17
51.05
5.75
53.16
7.86
53.26
7.96
54.37
9.07
57.16
11.86
2--26
0--28
3--33
1--35
0-36
5--40
3--42
1-44
8--47
5--50
3-52
10--56
7--59
5-61
13--65
9--69
7-71
注意:本例:n=11,R=1.5,P<0.005
两配对样本(相关样本)比较
• 适用条件:配对设计
•
对数一般小于50.
如:对12个样品分别用两种方法测量PAEs代 谢产物含量(微克/立方米),问两种方法所 得到结果有无差异?
如:对12个样品分别用三种方法测量PAEs代谢 产物含量(微克/立方米),问三种方法所得 到结果有无差异?
•非参检验假定前提比参数检验少得多,也容易满 足,适用于计量信息较弱的资料且计算方法简便, 适用性强,但检验效率较低,应用时应加以考虑。
2.分类
主要包括:
• 卡方检验: Chi-Square Tests • 二项式检验:Binomial Test • 游程检验:Runs Test
分布 类型 检验
• 一个样本柯本莫哥洛夫-斯米诺夫检验:1-Sample K-S
A组x
2.6 3.2
4.7 5.2 6.4
B组x 1.7 2.3 2.6
3.6 3.7
?
秩次 1 2 3 4 5 6 7 8 9 10
将两组比较原始数据(X)混合按大小编秩,如x相同取平 均秩,分别对各组的秩求和(T).
• 原始值中有两个“2.6”,分属A、B组,它们的 秩次应是3和4,然而它们的数值本来是同样大小 的,哪组取“3”,哪组取“4”呢?我们计算它们 的平均数(3+4)/2=3.5,作为“2.6”的秩次, 称为“平均秩次”,这样才公平合理。这样两组 所得的秩次及秩和如下:
Test Statisticsb
Z Asy mp. Sig. (2-tailed)
PAE S2法 PAE S1法
-2.282a
.022
a. Based on negative rank s.
b. Wilcoxon Signed Ranks Test
多个配对样本(相关样本)比较
• 适用条件:配对设计
值或<某值。 4.等级资料,当比较的数据只能用严重程度、
优劣等级的半定量(等级)资料组间的比较。
非参数检验—秩和检验
秩和非参数检验是推断一个总体表达分布位置的 中位数M和已知M0、两个或多个总体的分布是否 有差别。该检验先将数值变量资料从小到大, 或等级资料从弱到强转换成秩,再计算检验统 计量。特点是假设检验的结果对总体分布的形 状差别不敏感,只对总体分布的位置差别敏感。
2)选择两个检验变量(对)进入Test Variable list
3)选择检验方法。
SPSS提供三种检验方法(Test Type)。
Wilcoxon test(Wilcoxon Signed-Rank test)威尔科克森符号 秩检验:不但考虑关于两个符号的差异,且考虑成对间差异的 数量。比符号检验更有效。用于配对样本非参检验。
T界值表(配对比较的符号秩和检验用)
N
单侧:0.05 双侧:0.10
单侧:0.025 单侧:0.01 单侧:0.005 双侧:0.05 双侧:0.02 双侧:0.010
5 0--15
6 2--19
0--21
7 3--25
2--26
0--28
8 5--31
3--33
1--35
0-36
9 8--37
5--40
怎样选用不同设计的秩和检验方法
1)首先要区分试验设计和资料的类型: 2)若是一个样本资料或者配对设计的资料, 来自
非正态总体或总体分布无法确定,可选用 wilcoxon符号秩和检验方法; 3)若是两组独立样本资料,来自非正态分布的定 量资料或有序二分类变量资料(等级资料)宜用 wilcoxon秩和检验;
单个样本的Wilcoxon符号秩和检验
• 单个样本中位数和总体中位数比较,目的 是推断样本所来自的总体中位数M与某个已 知的中位数M0是否有差别。
• 用样本各变量与M0的差值,即推断差值的 总体中位数和0是否有差别。
• 已知某地正常人尿氟含量的中位数为 45.30µmol/L,今在该地某厂随机抽取12名 工人,测得尿氟含量如表所示。
秩和检验的方法----秩转换 秩和检验的基本计算步骤:
1.将数据(x)按大小转化为秩次(i),用秩 次的大小反映变量值的大小。
2.对各组”秩次”求和,称为秩和(T =∑i)。
3.对各组秩和(T)做检验的方法称为秩和检验。
例子:秩和计算
• 两组各有5个变量值。现在依从小到大的顺序将 它们排列起来,并标明秩次,结果如下:
3.33
PAES2法 - Positive Ranks 9(b)
7.56
PAES1法
Ties
0(c)
10.00 68.00
Total
12
a PAES2法 < PAES1法,变量PAES2法中变量值小于变量PAES1法的有3个 b PAES2法 > PAES1法,变量PAES2法中变量值大于变量PAES1法的有9个 c PAES2法 = PAES1法,变量PAES2法中变量值等于变量PAES1法的有0个
2.编秩号。
• (1)剔去差数为0的数据;
• (2)余下的n个差数按绝对值自小至大排秩号,但排 好后秩号要保持原差数的正负号,正负秩分开列;
• (3)差数绝对值相等(相同秩,ties)时,要以平均 秩表示,如差数绝对值为1.09者共2个,其秩号依次应 为1、2,现皆取平均秩号1.5。
3.求秩号和即将正、负秩号分别相加,分栏写,本例得正 秩号和为64.5,负秩号和为1.5。
4. 检验统计量R取较小一个秩号和,R=1.5,有效差值个数
n=11(差值0无效)根据R值查两配对样本T界值表,得
单侧P<0.005,按0.05水平拒绝H0,差异有统计学意义。 注意:查表时,在左侧找到对子数n,将检验统计量R 值与n右侧相邻栏内的界限值相比。
R在界限值内,则其P值大于表上端纵标目之概率水 平; R等于界限值,则其P值等于相应概率水平; R在界限值外,则P值小于相应概率水平,向右移动 一栏,再与界限值比较。
4)单击OK。
数据输入格式 输入过程
Asymptotic only 采用渐进方法计算确切 概率,默认检验方法
Monte Carto 采用蒙特卡洛模拟方法计 算确切概率
Exact Fisher 确切概率法
SPSS 输出结果 Ranks
N
Mean Rank
Sum of Ranks
Negative Ranks 3(a)
3
1
11
12
3
6
8
6
6
68 10
检验步骤
(1)正态性检验 (2)H0:差值总体中位数=0 (3)H1:差值总体中位数≠0,α=0.05 (4)计算检验统计量T值:
省略差值为0的对子数,得到余下对子数n=12 差值排秩,分别计算差值正秩、负秩之和 取较小秩号和,R=10 (5)查临界值表,R=10,n=12,双侧,得 0.01<P<0.05 差异有统计学意义。
• A组 3.5 5 8 9 10 /35.5
• B组 1 2 3.5 6 7 /19.5
• 总秩和:55.
• 上面A组和B组中各有五个原始值,按顺序排 列:最小值设为1,再按绝对值大小对余下的 变量逐个排序,最大值为两组变量个数之和 10。依次可得1,2,3.5,3.5,5,6,7,8,9,10。 这10 个序号即是秩次。A组秩和就是等于 3.5+5+8+9+10=39.5,B组秩和就是等于 1+2+3.5+6+7=19.5。从两组的原始变量值也 可以初步看出:A组偏大,B组偏小。现在得 出的秩和也是A组大于B组,与由变量值所观 察到的一致。
3--42
1-44
10 10--45
8--47
5--50
3-52
11 13--53
10--56
7--59
5-61
12 17--61
13--65
9--69
7-71
N=12,R=10,0.01<P<0.05,
注意:省略差值为0的对子数,来计算n
SPSS过程
1)Analyze-Nonparametric Tests-2 Related Samples
计算方法同单样本Wilcoxon符号秩检验
序 PAEs 1法 PAEs 2 法
差
号 (1)
(2) (2)-(1)
1
39
55
16
2
42
54
12
3
51
55
4
4
43
47
4
5
55
53
-2
6
45
63
18
7
22
52
30
8
48
44
-4
9
40
48
8
10
45
55
10
11
40
32
-8
12
49
57
8
合计
秩号
正
负
10
9
3
T界值表(配对比较的符号秩和检验用)
N
单侧:0.05 双侧:0.10
5 0--15
6 2--19
7 3--25
8 5--31
9 8--37
10 10--45
11 13--53
12 17--61
单侧:0.025 单侧:0.01 单侧:0.005 双侧:0.05 双侧:0.02 双侧:0.010
0--21
• 两个独立样本检验:2-Independent Samples Tests
• 多个独立样本检验:K Independent Samples Tests
• 两个相关样本检验:2-Related Samples • 多个相关样本检验:k-Related Samples
显著 性检 验
3.适用范围
适用范围广,适用范围: 1.数据分布为偏态分布或不满足参数检验方法
非参数检验
• 许多调查或实验所得的科研数据,常常具有如下特点: (1)资料的总体分布类型未知或无法确定; (2)资料分布类型已知,但不符合正态分布; (3)某些变量可能无法精确测量如等级资料。 (4)一端或两端为不确定数值的资料 这时做统计分析就不能使用参数检验,而是要采用非参
数检验:即不考虑总体分布类型是否已知,不比较总 体参数,只比较总体分布的位置是否相同的统计方法。
秩和检验概述
“秩”:按数据大小排定的次序号,又称秩次号。 编秩:将观察值按顺序由小到大排列,并用序号代替原始
变量值本身。 用秩次号代替原始数据后,所得某些秩次号之和,即按某
种顺序排列的序号之和,称为秩和,反映了一组数据在 分布上的范围位置。 基本思想: 基于秩次(通过编秩,用秩次代替原始数据信息来进行检 验)。 即检验各组的平均秩或秩和是否相等。如果经检验得各组 的平均秩和秩和不相等,则可以推论数据的分布不同。
67.37
22.07
71.05
25.75
87.37
42.07
-
正秩 负秩 1.5
1.5 3 4 5 6 7 8 9 10 11 64.5 1.5
检验步骤:
先进行正态分布与否的检验,确认不服从正态分布。用 Wilcoxon符号秩检验。
1.H0:尿含量中位数M=45.30,样本含量与正常值无差 异
• H1:M>45.30。 a=0.05
Sign test符号检验:对所有样品计算两个变量值间的差并将差值 分为正、负或结3类(秩)。如果两个变量有类似的分布,则 正、负数差异无显著不同。
McNemar检验:每个被试对象的反应被抽查两次,分别在指定事 件发生的前、后,McNemar检验确定初始的反应的比率,是 否等于最终反应的比率。该检验用来探究取决于试验干涉前、 后设计中反应的变化。用于配对计数资料差异检验。
4)若是多组独立样本资料,来自非正态总 体或方差不齐(转化后也不满足)的定量 资料或者是有序多分类变量资料(等级资 料)宜用Kruskal-Wallis秩和检验。
5)若是随机区组设计的自非正态总体或方 差不齐(转化后也不满足)的定量资料, 宜用Firedman秩和检验。
6)各种类型的秩和检验通常有查表法和正 态近似法两种计算方式,分别适用于不同 样本量的资料。在相同秩次的个数大于样 本量的25%时需要采用相应的公式进行校 正。
1.基本概念
•参数检验(parametric test):假定比较数据服从某 分布,通过参数的估计量对比较总体的参数(μ)作检 验,称参数法检验。如t检验、方差分析。
•非参数检验(Nonparametric test)是指在总体分 布情况不明时,用来检验数据资料是否来自同一 个总体假设的一类检验方法。
12名工人的尿氟含量(µmol/L)
序号 1 2 3 4 5 6 7 8 9 10 11 12 合计
尿氟含量(1) 差值d=(1)-45.30
44.21
-1.09
45.30
0
Baidu Nhomakorabea
46.39
1.09
49.47
4.17
51.05
5.75
53.16
7.86
53.26
7.96
54.37
9.07
57.16
11.86
2--26
0--28
3--33
1--35
0-36
5--40
3--42
1-44
8--47
5--50
3-52
10--56
7--59
5-61
13--65
9--69
7-71
注意:本例:n=11,R=1.5,P<0.005
两配对样本(相关样本)比较
• 适用条件:配对设计
•
对数一般小于50.
如:对12个样品分别用两种方法测量PAEs代 谢产物含量(微克/立方米),问两种方法所 得到结果有无差异?
如:对12个样品分别用三种方法测量PAEs代谢 产物含量(微克/立方米),问三种方法所得 到结果有无差异?
•非参检验假定前提比参数检验少得多,也容易满 足,适用于计量信息较弱的资料且计算方法简便, 适用性强,但检验效率较低,应用时应加以考虑。
2.分类
主要包括:
• 卡方检验: Chi-Square Tests • 二项式检验:Binomial Test • 游程检验:Runs Test
分布 类型 检验
• 一个样本柯本莫哥洛夫-斯米诺夫检验:1-Sample K-S
A组x
2.6 3.2
4.7 5.2 6.4
B组x 1.7 2.3 2.6
3.6 3.7
?
秩次 1 2 3 4 5 6 7 8 9 10
将两组比较原始数据(X)混合按大小编秩,如x相同取平 均秩,分别对各组的秩求和(T).
• 原始值中有两个“2.6”,分属A、B组,它们的 秩次应是3和4,然而它们的数值本来是同样大小 的,哪组取“3”,哪组取“4”呢?我们计算它们 的平均数(3+4)/2=3.5,作为“2.6”的秩次, 称为“平均秩次”,这样才公平合理。这样两组 所得的秩次及秩和如下:
Test Statisticsb
Z Asy mp. Sig. (2-tailed)
PAE S2法 PAE S1法
-2.282a
.022
a. Based on negative rank s.
b. Wilcoxon Signed Ranks Test
多个配对样本(相关样本)比较
• 适用条件:配对设计