非参数检验的概念与过程
合集下载
【统计分析】非参数检验
α=0.05 2. 计算统计量: T+=62.5,T-=3.5
3. 查表与结论 查T界值表,T0.05(11)=10~56,T=3.5,在界 值范围外,P<0.05,拒绝H0。
符号检验(Sign test)
z n n 1 n
二、两样本比较的秩和检验 (Wilcoxon法)
适用条件:完全随机设计的两个样本比较,若不满足参数 检验的应用条件,则用本法;两个等级资料比较。
-0.45
-1
13
15.20
5.50
9.70
11
14
16.50
9.00
7.50
8.5
步骤
1. 建立假设:H0:差值的总体中位数=0, H1:差值的总体中位数0;
=0.05 2. 计算统计量
计算差值d,由小到大的顺序编秩次,并冠以原d 的正负号,然后分别求正负秩和,得到T+=73, T-=5,取秩和较小者作为检验统计量T=5 3. 查表及结论
1.0
2.5
4
17.00
6.50
10.50
12
5
13.00
5.50
7.50
8.5
6
18.00
13.50
4.50
5
7
17.50
10.00
7.50
8.5
8
10.20
10.20
0.00
-
9
10.00
10.00
0.00
-
10
10.50
9.50
1.00
2.5
11
13.80
6.80
7.00
6
12
3.03
3.48
3. 查表与结论 查T界值表,T0.05(11)=10~56,T=3.5,在界 值范围外,P<0.05,拒绝H0。
符号检验(Sign test)
z n n 1 n
二、两样本比较的秩和检验 (Wilcoxon法)
适用条件:完全随机设计的两个样本比较,若不满足参数 检验的应用条件,则用本法;两个等级资料比较。
-0.45
-1
13
15.20
5.50
9.70
11
14
16.50
9.00
7.50
8.5
步骤
1. 建立假设:H0:差值的总体中位数=0, H1:差值的总体中位数0;
=0.05 2. 计算统计量
计算差值d,由小到大的顺序编秩次,并冠以原d 的正负号,然后分别求正负秩和,得到T+=73, T-=5,取秩和较小者作为检验统计量T=5 3. 查表及结论
1.0
2.5
4
17.00
6.50
10.50
12
5
13.00
5.50
7.50
8.5
6
18.00
13.50
4.50
5
7
17.50
10.00
7.50
8.5
8
10.20
10.20
0.00
-
9
10.00
10.00
0.00
-
10
10.50
9.50
1.00
2.5
11
13.80
6.80
7.00
6
12
3.03
3.48
第6章 非参数检验
8.5
3 1
17
8.5
8 4
5 2
13 6
7 3
19 10
8+9 = 8.5 2
中央财经大学统计学院 37
Wilcoxon符号秩检验:基本原理 符号秩检验: 符号秩检验
分别计算出差值序列中正数的秩和以及负 数的秩和。 显然,如果零假设成立,W+与W-应该比较 接近。如果二者过大或过小,则说明零假 设不成立。 将正数的秩和或者负数的秩作为检验统计 量,根据其统计分布计算p值,从而可以得 出检验的结论。
中央财经大学统计学院 38
特别说明
符号检验在匹配数据分析应用中只用到差 值的符号,而对差值数值的大小未能考虑, 因而失去了部分信息。Wilcoxon符号秩检 验既考虑差值的符号,又考虑差值的大小, 因此在所需的假设条件满足时其功效比符 号检验高。 Wilcoxon符号秩检验也可以用于单样本中 位数的非参数检验,这时只需要将第二个 样本的值设为零假设中的数值即可。
中央财经大学统计学院 33
符号检验
对于差值序列中正数的个数和负数的个数 按照符号检验的方法进行假设检验
中央财经大学统计学院
34
Wilcoxon符号秩检验:基本原理 符号秩检验: 符号秩检验
计算差值绝对值的秩 。 将差值绝对值从小到大排序,其位次就是 的秩(rank),等于0值不参与排序。
中央财经大学统计学院
中央财经大学统计学院 18
软件操作
在SPSS软件中打开数据文件,选择“分析” “非参数检 验” “1样本K-S”,在弹出的对话框中将“时间”设定为 检验变量;检验分布为默认的“常规”(正态分布)。单 击 “确定”
中央财经大学统计学院
19
结果分析
3 1
17
8.5
8 4
5 2
13 6
7 3
19 10
8+9 = 8.5 2
中央财经大学统计学院 37
Wilcoxon符号秩检验:基本原理 符号秩检验: 符号秩检验
分别计算出差值序列中正数的秩和以及负 数的秩和。 显然,如果零假设成立,W+与W-应该比较 接近。如果二者过大或过小,则说明零假 设不成立。 将正数的秩和或者负数的秩作为检验统计 量,根据其统计分布计算p值,从而可以得 出检验的结论。
中央财经大学统计学院 38
特别说明
符号检验在匹配数据分析应用中只用到差 值的符号,而对差值数值的大小未能考虑, 因而失去了部分信息。Wilcoxon符号秩检 验既考虑差值的符号,又考虑差值的大小, 因此在所需的假设条件满足时其功效比符 号检验高。 Wilcoxon符号秩检验也可以用于单样本中 位数的非参数检验,这时只需要将第二个 样本的值设为零假设中的数值即可。
中央财经大学统计学院 33
符号检验
对于差值序列中正数的个数和负数的个数 按照符号检验的方法进行假设检验
中央财经大学统计学院
34
Wilcoxon符号秩检验:基本原理 符号秩检验: 符号秩检验
计算差值绝对值的秩 。 将差值绝对值从小到大排序,其位次就是 的秩(rank),等于0值不参与排序。
中央财经大学统计学院
中央财经大学统计学院 18
软件操作
在SPSS软件中打开数据文件,选择“分析” “非参数检 验” “1样本K-S”,在弹出的对话框中将“时间”设定为 检验变量;检验分布为默认的“常规”(正态分布)。单 击 “确定”
中央财经大学统计学院
19
结果分析
第5讲SPSS非参数检验
二、操作
数据文件:“糖果中的卡路里.sav” 菜单:“分析→非参数检验→旧对话框→K个独立样本”
多独立样本非参数检验整体分析与设计的内容
输入最大值、 最小值。
Kruskal-Wallis H检 验:是曼-惠特尼U 检验在多个独立样 本下的推广。
检验各个样本是否来自有相同中位数的 总体。--- 这种检验的效能最低。
2)对数据的测量尺度无约束,对数据的要求也不严格,任何数据类型 都可以。
3)适用于小样本、无分布样本、数据污染样本、混杂样本等。
注:若参数检验模型的所有假设在数据中都能满足,而且测量达到了所 要求的水平,那么,此时用非参数检验就浪费了数据。
因此,若所需假设都满足的情况下,一般就选择参数检验方法。
卡方检验
此时,零假设:两总体的 均值无显著性差异;就可 能不成立。
K-S检验。以变量的秩 作为分析对象;而非变 量值本身。
也需要先将两组样本混 合、升序排列。
两独立样本非参数检验整体分析与设计的内容 二、操作
该检验有特定用途,给出的结果均为单侧 检验。若施加的处理时的某些个体出现正 向效应,而另一些个体出现负向效应时, 就应当采用该检验方法。 基本思想为:将一组样本作为控制样本, 另一组作为试验样本。以控制样本为对照, 检验试验样本相对于控制样本是否出现了 极端反应。若无极端反应,则认为两总体 分布无显著性差异;否则,有显著性差异。
选择分布
“结”的处理
单样本K-S检验
整体分析与设计的内容
三、补充描述性统计的P-P图和Q-Q图
P-P图的输出样子: P-P图
期望(理论)累计 概率值
去势P-P图
样本数据实际累计 概率值
实际与期望的差值
样本数据实际累计 概率值
数据文件:“糖果中的卡路里.sav” 菜单:“分析→非参数检验→旧对话框→K个独立样本”
多独立样本非参数检验整体分析与设计的内容
输入最大值、 最小值。
Kruskal-Wallis H检 验:是曼-惠特尼U 检验在多个独立样 本下的推广。
检验各个样本是否来自有相同中位数的 总体。--- 这种检验的效能最低。
2)对数据的测量尺度无约束,对数据的要求也不严格,任何数据类型 都可以。
3)适用于小样本、无分布样本、数据污染样本、混杂样本等。
注:若参数检验模型的所有假设在数据中都能满足,而且测量达到了所 要求的水平,那么,此时用非参数检验就浪费了数据。
因此,若所需假设都满足的情况下,一般就选择参数检验方法。
卡方检验
此时,零假设:两总体的 均值无显著性差异;就可 能不成立。
K-S检验。以变量的秩 作为分析对象;而非变 量值本身。
也需要先将两组样本混 合、升序排列。
两独立样本非参数检验整体分析与设计的内容 二、操作
该检验有特定用途,给出的结果均为单侧 检验。若施加的处理时的某些个体出现正 向效应,而另一些个体出现负向效应时, 就应当采用该检验方法。 基本思想为:将一组样本作为控制样本, 另一组作为试验样本。以控制样本为对照, 检验试验样本相对于控制样本是否出现了 极端反应。若无极端反应,则认为两总体 分布无显著性差异;否则,有显著性差异。
选择分布
“结”的处理
单样本K-S检验
整体分析与设计的内容
三、补充描述性统计的P-P图和Q-Q图
P-P图的输出样子: P-P图
期望(理论)累计 概率值
去势P-P图
样本数据实际累计 概率值
实际与期望的差值
样本数据实际累计 概率值
第13章 有序分类变量的统计推断——非参数检验
13.3.1 Mann-Whitney
U检验
记X和Y的秩和分别为WX和WY,满足 WX+WY=N(N+1)/2。 当X的样本全部排在Y的样本前面时, WX达到最小m(m+1)/2,定义统计量
U= WX -m(m+1)/2
当原假设成立时,两个样本交错出现, 分布均匀,U不会太小或者太大。反之, 如果U偏小或者偏大,则原假设不成立。
13.3.2 分析实例
例13.2
一家权威的房屋建筑协会 提供了最流行的家居装修工程的 成本数据,能否得出厨房的装修 成本与主卧室的装修成本存在差 异呢? 数据见npara2.sav
13.3.2 分析实例
AnalyzeNonparametric Tests 2 independent Samples
第13章计推断非参数检验有序分类变量的统第13章有序分类变量的统计推断非参数检验?131非参数检验概述?132两个配对样本的非参数检验?133两个独立样本的非参数检验131非参数检验概述?1311非参数检验的意义?1312非参数检验预备知识1311非参数检验的意义?非参数检验nonparametrictesting是指在总体不服从正态分布且分布情况不明时用来检验数据资料是否来自同一个总体假设的一类检验方法
13.3.1 Mann-Whitney
U检验
SPSS中提供了四种方法: Mann-Whitney U法(曼-惠特尼U检 验):
通过对平均秩的研究来实现推断的。 类似单样本检验的K-S法,通过对分布的 研究来实现推断。
Kolmogorov-Smirnov Z法:
13.3.1 Mann-Whitney
非参数检验
非参数检验的概念
非参数检验又称为任意(不拘) 非参数检验又称为任意(不拘)分布检验 distributiontest), ),这类方法 (distribution-free test),这类方法并不依赖总
非 参 数 检 验
体分布的具体形式,应用时可以不考虑研究变量 体分布的具体形式, 为何种分布以及分布是否已知,进行的是分布之 为何种分布以及分布是否已知, 间而不是参数之间的检验,故又称非参数检验
参数检验的特点
分析目的:对总体参数(µ π)进行估计或检验。 进行估计或检验。 分析目的:对总体参数(
非 参 数 检 验
分布:要求总体分布已知, 分布:要求总体分布已知,如:
•连续性资料——正态分布 连续性资料——正态分布 •计 数 资 料——二项分布、POISSON分布等 ——二项分布 POISSON分布等 二项分布、
序号 (1) 1 2 3 4 5 6 7 8 9 10 11 12
数据 (2) 39 42 45 43 52 45 22 48 40 45 40 49
排秩 ( 3)
非 参 数 检 验
非 参 数 检 验
疗效
A组 (1 ) 15 11 20 8
B组 (2 ) 12 3 7 4
排秩
平均秩次
控制 显效 有效 近控
参数检验方法的局限
非 参 数 检 验
t检验 成组t 成组t检验要求:正态、方差相等、个体独立 配对t 配对t检验要求:差值正态、个体独立 方差分析 单因素多水平比较方差分析要求:正态、方差 相等、个体独立 多个分析因素时方差分析要求:分布、方差、 个体独立性
定性无序分类资料
非 参 数 检 验
两组性别结构是否相同? 两组某种不良反应的发生率是否相同? 多组发生率是否相同? 多组构成是否相同?
T检验与非参数检验
02
t检验的种类
单样本t检验
总结词
用于检验一个样本均值与已知的某个值或某一组值的差异是否显著。
详细描述
单样本t检验是用来比较一个样本的均值与已知的某个值或某一组值的差异是否显著的统计方法。它通常用于检 验一个样本的平均值是否显著不同于某个特定的标准值,或者是否显著不同于另一个已知的样本均值。
配对样本t检验
与参数检验相比,非参数检验在假设 较少的情况下仍能提供有效的推断依 据。
非参数检验的适用范围
当总体分布未知或不符合正态分布时 ,非参数检验是一个合适的选择。
当数据不符合正态分布或总体分布未 知时,参数检验可能无法得出准确的 结论,而非参数检验不受这些限制。
非参数检验的特点
灵活性
非参数检验不依赖于特定的总体分布,因此可以应用 于多种不同类型的数据和情境。
详细描述
1. 正态分布
2. 独立性
3. 方差齐性
t检验的前提假设包括正 态分布、独立性和方差 齐性。
在应用t检验时,需要满 足以下前提假设
样本数据应来自正态分 布的总体,或至少可以 近似为正态分布。
两组样本数据应相互独 立,即一个样本的数据 不影响另一个样本的数 据。
两组样本的方差应具有 齐性,即它们的波动程 度相似。如果不能满足 方差齐性的假设,可能 需要使用其他统计方法 ,如Welch's t检验或 Satterthwaite's近似法 。
t检验的适用范围
总结词
t检验适用于检验两组独立或配对样本的均值差异,常用于小样本数据或总体分布不明 确的情况。
详细描述
t检验适用于比较两组独立样本的均值,例如在不同条件下选取的两个样本。此外,它 也适用于比较同一总体选取的两个配对样本的均值,例如同一对象在不同时间点的测量
8非参数检验
②正态近似法:
u | T n0 ( N 1) / 2 | n1n2 ( N 1) / 12
本例u 2.205 0.05/ 2 1.96
N3 N ; 3 3 N N (ti ti )
i
*校正公式(当相同秩次较多时)
uc u c; c
ti为第i个相同秩号的数据个数
假定:两组样本的总体分布形状相同
如果两总体 分布相同
基本思想
两样本来自同一总体 任一组秩和不应太大或太小
T 与平均秩和 n0 (1 N ) / 2 应相差不大
较小例数组的秩和, n1 n2 T min( R1 , R2 ), n1 n2
N n1 n2 n0 min( n1 , n2 )
控制 显效 有效 近控
65 18 30 13 126
107 24 53 24
1-107 108-131 132-184 185-208
54 119.5 158 196.5
编号 1 2
病情 单纯型 单纯型合并肺气肿
疗效 控制 显效
3
4 … 206 207
单纯型合并肺气肿
单纯型 … 单纯型 单纯型合并肺气肿
10 12(12 1) / 4 | R n(n 1) / 4 | u 2.275 n(n 1)(2n 1) / 24 12(12 1)(2 12 1) / 24
查标准正态分布表,得 P 值 校正公式: (当相同秩次个数较多时)
u
| R n(n 1) / 4 | n(n 1)(2n 1) / 24 (ti3 ti ) / 48 10 12(12 1) / 4
第一节 非参数检验的概念
第十讲 非参数检验
分析完全随机设计的多样本计量资料时,若多样本观察指标不满足正态性和方差齐性, 不能进行方差分析, 以及多样本观察指标为等级 (有序分类) 资料, 宜采用 Kruskal-Wallis H 秩和检验。
14
第二节秩和检验 —完全随机设计多样本的秩和检验
【例11-4】某医生在研究再生障碍性贫血时, 测得不同程度再生障碍性贫血患者血清中可溶 性CD8抗原水平(U/ml),结果见表11-5,问不 同程度再生障碍性贫血患者血清中可溶性CD8抗 原水平有无差别?
通常规定,当 n1 n2 时,取较小样本的秩和作为检验统计量 T ;当 n1 n2 时,取秩和 较小者作为检验统计量 T 。
9
第二节秩和检验 —成组设计资料的秩和检验
【例11-2】某医院某医生对28例糖尿病早期微血管病 变的患者,按年龄、性别、病程、中医证候评分、生存 质量量表评分、饮食控制等情况,随机分为两组,试验 组采用西药加中药联合治疗方法,对照组采用西药加安 慰剂治疗方法,治疗4周,测定24小时尿蛋白改变量, 结果见表11-3,问该中药对糖尿病患者早期微血管病变 有无疗效?
16
第二节秩和检验 —完全随机设计多样本的秩和检验
【例11-5】探讨中药联合NB-UVB治疗寻常性银 屑病的临床疗效。95例患者分为3组,治疗组35 例给予NB-UVB照射,同时中药浴疗;对照1组33 例予NB-UVB照射,对照2组30例给予中药浴疗。 结果见表11-6,试比较三组疗效是否有差异?
4
第一节 非参数检验简述
表 11-1 参数检验与非参数检验的区别 非参数检验 推断总体分布,如中位数是否相等,是 否符合某种分布 参数检验 推断总体的参数,如算数均数、方 差、率是否相等 已知总体分布:如正态分布、二项 分布、poission 分布
非参数检验
➢ 编秩:数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重(kg)xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验 (Friedman test)
正态近似法
如果n1或n2-n1超出附表的范围,可按下式 计算u值:
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时,应用下式进行校正:
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料(或等级资料)两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分 差 值
非参数检验的概念与过程
Test Variables: a b c Test type:选一种或多种 比较有用的结果:看sig值,sig<.05, 拒绝零假设,
认为顾客对三种款式衬衫的喜爱程度是不相同的。
补充:非参数检验
以下的讲义是吴喜之教授有关
非参数检验的讲义,
我觉得比书上讲得清楚。
非参数检验
为什么用非参数方法?
非参数检验
说明:非参数检验这章,请看下面吴 喜之教授的讲义,更为具体的可参看 《统计分析与SPSS的应用》薛薇 编著 人大出版社,2002.7第二次印刷
非参数检验的概念
是指在总体不服从正态分布且分布情况 不明时,用来检验数据资料是否来自同 一个总体假设的一类检验方法。由于这 些方法一般不涉及总体参数故得名。 这类方法的假定前提比参数性假设检验 方法少的多,也容易满足,适用于计量 信息较弱的资料且计算方法也简单易行, 所以在实际中有广泛的应用。
Cochran Q:要求样本数据为二值的(1-满意 0-不满意) Friedman:利用秩实现 Kendall协同系数检验:H0:协同系数为0(评分标准不相关的
或者是随机的) 实例 :9个顾客对三种款式衬衫的喜爱程度(1-最喜爱 2-其
次 3-不喜爱)。数据data12-09(3个变量: 款式A,款式B, 款式C, 27个cases)。试问顾客对三种款式衬衫的喜爱程度 是否相同。 Analyze-> Nonparametric Tests-> k related Samples
Test Pairs: dlq-dlh Test type:选一种或多种 比较有用的结果:看sig值,sig<.05, 拒绝零假设,
认为锻炼前后的晨脉有显著性的差异。
12.8 多个相关样本检验
认为顾客对三种款式衬衫的喜爱程度是不相同的。
补充:非参数检验
以下的讲义是吴喜之教授有关
非参数检验的讲义,
我觉得比书上讲得清楚。
非参数检验
为什么用非参数方法?
非参数检验
说明:非参数检验这章,请看下面吴 喜之教授的讲义,更为具体的可参看 《统计分析与SPSS的应用》薛薇 编著 人大出版社,2002.7第二次印刷
非参数检验的概念
是指在总体不服从正态分布且分布情况 不明时,用来检验数据资料是否来自同 一个总体假设的一类检验方法。由于这 些方法一般不涉及总体参数故得名。 这类方法的假定前提比参数性假设检验 方法少的多,也容易满足,适用于计量 信息较弱的资料且计算方法也简单易行, 所以在实际中有广泛的应用。
Cochran Q:要求样本数据为二值的(1-满意 0-不满意) Friedman:利用秩实现 Kendall协同系数检验:H0:协同系数为0(评分标准不相关的
或者是随机的) 实例 :9个顾客对三种款式衬衫的喜爱程度(1-最喜爱 2-其
次 3-不喜爱)。数据data12-09(3个变量: 款式A,款式B, 款式C, 27个cases)。试问顾客对三种款式衬衫的喜爱程度 是否相同。 Analyze-> Nonparametric Tests-> k related Samples
Test Pairs: dlq-dlh Test type:选一种或多种 比较有用的结果:看sig值,sig<.05, 拒绝零假设,
认为锻炼前后的晨脉有显著性的差异。
12.8 多个相关样本检验
非参数检验
本例n=11,T=11.5,查附表9,得双侧0.05<P<0.10,按 =0.05水准不拒绝H0,尚不能认为两法测谷-丙转氨酶结果有差 别。
若n>50,超出附表9的范围,可用正态近似法作u检验,按 下式计算u值。
对秩的差值,省略所有差值为0的对子数,令余下的有效对子数
为n;最后按n个差值编正秩和负秩,求正秩和或负秩和。但对 于等级资料,相同秩多,小样本的检验结果会存在偏性,最好 用大样本。
的多个独立样本所来自的多个总体分布是否有差别。在理论
上检验假设H0应为多个总体分布相同,即多个样本来自同一 总体。由于H检验对多个总体分布的形状差别不敏感,故在实
际应用中检验假设H0可写作多个总体分布位置相同。对立的
备择假设H1为多个总体分布位置不全相同。
1.原始数据的多个样本比较
方法步骤见例8-5.
样本所来自的两个总体中位数是否有差别。方法步骤见例8l。
例8-1 对12份血清分别用原方法(检测时间20分钟)和新 方法(检测时间10分钟)测谷-丙转氨酶,结果见表8-1的(2)、 (3)栏。问两法所得结果有无差别?
血清谷-丙转氨酶不知是否符合正态分布,本例为小样 本资料,其配对差值经正态性检验得0.1<P<0.2,虽可用配对t 检验,为保守起见,现用Wilcoxon符号秩检验。
用于推断计量资 料或等级资料的两个独立样本所来
自的两个总体分布是否有差别。
在理论上检验假设H0应为两个总体分布相同,即 两个样本来自同一总体。由于秩和检验对于两个总体分布 的形状差别不敏感,对于位置相同形状不同但类似的两个 总体分布,如均数相等、方差不等的两个正态分布,推断
不出两个总体分布(形状)有差别,故对立的备择假设Hl不
若n>50,超出附表9的范围,可用正态近似法作u检验,按 下式计算u值。
对秩的差值,省略所有差值为0的对子数,令余下的有效对子数
为n;最后按n个差值编正秩和负秩,求正秩和或负秩和。但对 于等级资料,相同秩多,小样本的检验结果会存在偏性,最好 用大样本。
的多个独立样本所来自的多个总体分布是否有差别。在理论
上检验假设H0应为多个总体分布相同,即多个样本来自同一 总体。由于H检验对多个总体分布的形状差别不敏感,故在实
际应用中检验假设H0可写作多个总体分布位置相同。对立的
备择假设H1为多个总体分布位置不全相同。
1.原始数据的多个样本比较
方法步骤见例8-5.
样本所来自的两个总体中位数是否有差别。方法步骤见例8l。
例8-1 对12份血清分别用原方法(检测时间20分钟)和新 方法(检测时间10分钟)测谷-丙转氨酶,结果见表8-1的(2)、 (3)栏。问两法所得结果有无差别?
血清谷-丙转氨酶不知是否符合正态分布,本例为小样 本资料,其配对差值经正态性检验得0.1<P<0.2,虽可用配对t 检验,为保守起见,现用Wilcoxon符号秩检验。
用于推断计量资 料或等级资料的两个独立样本所来
自的两个总体分布是否有差别。
在理论上检验假设H0应为两个总体分布相同,即 两个样本来自同一总体。由于秩和检验对于两个总体分布 的形状差别不敏感,对于位置相同形状不同但类似的两个 总体分布,如均数相等、方差不等的两个正态分布,推断
不出两个总体分布(形状)有差别,故对立的备择假设Hl不
非参数检验的名词解释
非参数检验的名词解释
非参数检验是一种统计方法,用于在数据不满足正态分布或其他假设条件的情况下进行统计推断。
与参数检验相比,非参数检验不需要对总体参数做出假设,而是直接利用样本数据进行推断。
以下是相关名词解释:
1. 非参数:指在进行统计推断时,不对总体的分布形式或参数做出特定的假设。
非参数方法依赖于具体的样本数据,不依赖于总体的分布特征。
2. 假设检验:统计推断的一种方法,用于通过对样本数据进行分析来得出关于总体参数或总体分布的结论。
假设检验通常涉及对某个假设的拒绝或接受。
3. 正态分布:也称为高斯分布,是一种连续概率分布,常用于描述许多自然现象和随机变量的分布。
参数检验通常基于对总体数据服从正态分布的假设。
4. 参数检验:通过对总体参数的估计和假设进行统计推断的
方法。
参数检验通常要求数据满足特定的假设条件,如正态分布、独立性和方差齐性等。
5. 统计显著性:在假设检验中,用于评估观察到的差异或效应是否显著。
统计显著性通常以p值表示,若p值小于预设的显著性水平(如0.05),则可以拒绝零假设。
非参数检验在实际应用中具有灵活性和广泛适用性,特别适合处理样本数据不满足假设条件的情况。
它们不依赖于总体分布的形式,因此更加鲁棒,并可以应用于各种类型的数据集。
生物统计学:非参数检验
{ n+,n-}= n+=2 。
3、统计推断 当n=15时, 查附表11 得 临 界 值K0.05(15)=3 , K0.01(15) = 2 , 因 为 K = 2 = K0.01(15),P≤0.01,表明噪数与总体中位数比较的符号检验
1、建立假设 HO:样本所在的总体中位数=已知总体中 位数; HA :样本所在的总体中位数≠已知总体 中位数。 (若将备择假设 HA 中的“≠”改为“<” 或“>”,则进行一尾检验)
依赖于特定分布类型, 比较的是参数
优点:方法简便、易学易用,易于推广使用、应用范围广;可 用于参数检验难以处理的资料(如等级资料,或含数值 “>50mg”等)。 缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数 检验会损失部分信息,其检验效能低;样本含量较大时,两者 结论常相同。
第一节 符号检验
非参数检验的弱点 可能会浪费一些信息 特别当数据可以使用参数模型的时候 大样本手算相对麻烦 一些表不易得到
参数检验 (parametric test)
非参数检验 (nonparametric test)
已知总体分布类型,对 未知参数进行统计推断
对总体的分布类型不作严 格要求 不受分布类型的影响, 比较的是总体分布位置
124.3 147.9 -15.7 7.9 +
1、提出无效假设与备择假设
HO :该地成年公黄牛胸围的平均数=140厘米, HA :该地成年公黄牛胸围的平均数≠140厘米。
2、计算差值、确定符号及其个数 样本各观测值与总体 平均数的差值及其符号列于表 11-2 ,并由此得 n+=6 ,n-=4 ,
非参数统计的名字中“非参数”意味着其方法不 涉及描述总体分布的有关参数;
SPSS第6章 非参数检验
Test)
•现实生活中有很多现象的数据取值仅分两类,例如:学生可以按性别 分成男生和女生,产品可以按质量分成合格和不合格,投掷硬币实验的 结果可能出现正面或反面等。这时,如果某一类情况出现的概率是P, 则另一类情况出现的概率就是Q(即1-P),这种分布称为二项分布。 •【例6-3】根据过去的观察,用旧方法生产某种产品,其不合格率为1%。 现采用新方法,在600件产品中,发现了2件不合格品,问是否可以认为 新方法的不合格率明显低于旧方法的不合格率? •1、方法基本思路 •二项检验属于拟合优度检验,适用于数据只能划分为两类的总体。二 项检验是检验是否认为从样本中观察到的两类比例来自具有指定P的总 体。H0:样本所属总体的分布形态与指定的二项分布无显著差异。 •就例6-3而言,H0:样本所属总体分布是P=1%的二项分布。 •SPSS中的二项分布检验,在样本数小于等于30时,按照计算二项分布概 率的公式进行计算;在样本数大于30时,计算的是Z统计量。SPSS将自 动计算Z统计量,并给出其所对应的概率值。如果Z值对应的概率值小于 或等于给定的显著性水平α,则应拒绝H0,认为样本所属的总体分布形 态与指定的二项分布存在显著差异;如果对应的概率值大于给定的显著 性水平α,则没有足够理由拒绝H0,认为样本所属的总体分布形态与指 定的二项分布无显著差异。
•c.“Expected Values”选项区可设定总体的各类别构成。若选用默认值则表示 所有各类构成比都相等;在“Values”框中可自行定义设定总体的各类构成, 输入的数值的个数和排放次序应和数据文件中的相对应。本例选用默认值。
•d. 单击图6.2主对话框中的“Options”按钮进行统计,“Statistics”用于确定 是否需要输出描述统计指标和分位数。
3、简要评论
•现实生活中有很多现象的数据取值仅分两类,例如:学生可以按性别 分成男生和女生,产品可以按质量分成合格和不合格,投掷硬币实验的 结果可能出现正面或反面等。这时,如果某一类情况出现的概率是P, 则另一类情况出现的概率就是Q(即1-P),这种分布称为二项分布。 •【例6-3】根据过去的观察,用旧方法生产某种产品,其不合格率为1%。 现采用新方法,在600件产品中,发现了2件不合格品,问是否可以认为 新方法的不合格率明显低于旧方法的不合格率? •1、方法基本思路 •二项检验属于拟合优度检验,适用于数据只能划分为两类的总体。二 项检验是检验是否认为从样本中观察到的两类比例来自具有指定P的总 体。H0:样本所属总体的分布形态与指定的二项分布无显著差异。 •就例6-3而言,H0:样本所属总体分布是P=1%的二项分布。 •SPSS中的二项分布检验,在样本数小于等于30时,按照计算二项分布概 率的公式进行计算;在样本数大于30时,计算的是Z统计量。SPSS将自 动计算Z统计量,并给出其所对应的概率值。如果Z值对应的概率值小于 或等于给定的显著性水平α,则应拒绝H0,认为样本所属的总体分布形 态与指定的二项分布存在显著差异;如果对应的概率值大于给定的显著 性水平α,则没有足够理由拒绝H0,认为样本所属的总体分布形态与指 定的二项分布无显著差异。
•c.“Expected Values”选项区可设定总体的各类别构成。若选用默认值则表示 所有各类构成比都相等;在“Values”框中可自行定义设定总体的各类构成, 输入的数值的个数和排放次序应和数据文件中的相对应。本例选用默认值。
•d. 单击图6.2主对话框中的“Options”按钮进行统计,“Statistics”用于确定 是否需要输出描述统计指标和分位数。
3、简要评论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
匀。
实例1的数据可以组织成:两个变量(side面和 number次数),6个cases。但在卡方检验前要求用 number加权。结果同。
补充:卡方检验实例
实例:心脏病人猝死人数与日期的关系,收集168个观 测数据。其中用1、2、3、4、5、6、7表示是星期几 死的。而人数分别为55、23、18、11、26、20、15。 推断心脏病人猝死人数与日期的关系是否为 2.8:1:1:1:1:1:1。(变量2个:死亡日期和死亡人数, Cases 7个) 加权:Data->Weight Cases:死亡人数 Analyze-> Nonparametric Tests->Chi Square
Analyze-> Nonparametric Tests-> Binomial Test Variable: tbh 由于这是一个均匀分布检测,使用默认选择(Test
Proportion:0.5); 比较有用的结果:两组个数和sig=1.00>0.5,不能拒绝零假
设,认为挑边器是均匀。
实例1的数据可以组织成:两个变量(side面和 number次数),2个cases。但在二项分布检验前要 求用number加权。结果同。
Analyze-> Nonparametric Tests->Chi Square Test Variable: lmt 想要检验的变量 由于这是一个均匀分布检测,使用默认选择(Expected
Values:All categories equal作为零假设); 比较有用的结果:sig=.111>0.5,不能拒绝零假设,认为均
认为挑边器出现AB面是随机的。
Runs Test
Test Valuea Total Cases Number of Runs Z Asymp. Sig. (2-tailed)
a. User-specified.
TBH 2
31 21 1.469 .142
12.4 一个样本柯尔莫哥洛夫-斯米诺夫检验 1-Sample Kolmogorov-Smirnov test
31次,变量tbh,1为出现A面、2为出现A面,试问这
挑边器出现AB面是否随机。数据data12-03(31个
cases)。
Analyze-> Nonparametric Tests-> Runs
Test Variable: tbh Cut Point:Custom:2 比较有用的结果:
总case数(31)、 游程Run数(21)、 sig=.142>0.5, 不能拒绝零假设,
非参数检验
说明:非参数检验这章,请看下面吴 喜之教授的讲义,更为具体的可参看 《统计分析与SPSS的应用》薛薇 编著 人大出版社,2002.7第二次印刷
非参数检验的概念
是指在总体不服从正态分布且分布情况 不明时,用来检验数据资料是否来自同 一个总体假设的一类检验方法。由于这 些方法一般不涉及总体参数故得名。 这类方法的假定前提比参数性假设检验 方法少的多,也容易满足,适用于计量 信息较弱的资料且计算方法也简单易行, 所以在实际中有广泛的应用。
12.1 卡方检验 Chi-Square test
这否有同样比例或者等于你所想象的比例(如 5:4:1) 实例1:掷骰子300次,变量LMT,1、2、3、4、5、 6分别代表六面的六个点,试问这骰子是否均匀。数据 data12-01(300个cases)。
Test Variable:一等品 Test Proportion:0.9 比较有用的结果:两组个数和sig=.193>0.5,不能拒绝零假
设,认为该批产品的一等品率达到了90% 。
12.3 游程检验Runs test
单样本变量随机性检验是对某变量值出现是否随机进行
检验。
实例1(同二项分布检验) :掷一枚比赛用的挑边器
非参数检验的过程
1. Chi-Square test 卡方检验 2. Binomial test 二项分布检验 3. Runs test 游程检验 4. 1-Sample Kolmogorov-Smirnov test 一个样本 柯尔莫哥洛夫-斯米诺夫检验 5. 2 independent Samples Test 两个独立样本检验 6. K independent Samples Test K个独立样本检验 7. 2 related Samples Test 两个相关样本检验 8 . K related Samples Test 两个相关样本检验
Test Variable:死亡日期 Expected Values: 2.8:1:1:1:1:1:1 比较有用的结果:sig=.256>0.5,不能拒绝零假设,认为心
脏病人猝死人数与日期的关系为2.8:1:1:1:1:1:1 。
12.2 二项分布检验 Binomial test
二项分布:在现实生活中有很多的取值是两类的,如人 群的男和女、产品的合格和不合格、学生的三好学生和 非三好学生、投掷硬币的正面和反面。这时如果某一类 出现的概率是P,则另一类出现的概率就是1-P。这种 分布称为二项分布。 实例1:掷一枚比赛用的挑边器31次,变量tbh,1为 出现A面、2为出现A面,试问这挑边器是否均匀。数据 data12-03(31个cases)。
补充:二项分布检验实例
实例:为验证某批产品的一等品率是否达到90%,现 从该批产品中随机抽取23个样品进行检测,结果有19 个一等品(1-一等品,0-非一等品)。(变量2个: 一等品和个数,Cases 2个:1 19 和0 4) 加权:Data->Weight Cases:个数 Analyze-> Nonparametric Tests-> Binomial
单样本K-S检验是利用样本数据推断总体是否服从某一理论分布,
适用于探索连续型随机变量的分布形态(判断定距变量的分布情
况):Normal正态分布、Uniform均匀分布、Poisson泊松分布、
Exponential指数分布。
实例 :卢瑟福和盖革作了一个著名的实验,他们观察了长为7.5秒
实例1的数据可以组织成:两个变量(side面和 number次数),6个cases。但在卡方检验前要求用 number加权。结果同。
补充:卡方检验实例
实例:心脏病人猝死人数与日期的关系,收集168个观 测数据。其中用1、2、3、4、5、6、7表示是星期几 死的。而人数分别为55、23、18、11、26、20、15。 推断心脏病人猝死人数与日期的关系是否为 2.8:1:1:1:1:1:1。(变量2个:死亡日期和死亡人数, Cases 7个) 加权:Data->Weight Cases:死亡人数 Analyze-> Nonparametric Tests->Chi Square
Analyze-> Nonparametric Tests-> Binomial Test Variable: tbh 由于这是一个均匀分布检测,使用默认选择(Test
Proportion:0.5); 比较有用的结果:两组个数和sig=1.00>0.5,不能拒绝零假
设,认为挑边器是均匀。
实例1的数据可以组织成:两个变量(side面和 number次数),2个cases。但在二项分布检验前要 求用number加权。结果同。
Analyze-> Nonparametric Tests->Chi Square Test Variable: lmt 想要检验的变量 由于这是一个均匀分布检测,使用默认选择(Expected
Values:All categories equal作为零假设); 比较有用的结果:sig=.111>0.5,不能拒绝零假设,认为均
认为挑边器出现AB面是随机的。
Runs Test
Test Valuea Total Cases Number of Runs Z Asymp. Sig. (2-tailed)
a. User-specified.
TBH 2
31 21 1.469 .142
12.4 一个样本柯尔莫哥洛夫-斯米诺夫检验 1-Sample Kolmogorov-Smirnov test
31次,变量tbh,1为出现A面、2为出现A面,试问这
挑边器出现AB面是否随机。数据data12-03(31个
cases)。
Analyze-> Nonparametric Tests-> Runs
Test Variable: tbh Cut Point:Custom:2 比较有用的结果:
总case数(31)、 游程Run数(21)、 sig=.142>0.5, 不能拒绝零假设,
非参数检验
说明:非参数检验这章,请看下面吴 喜之教授的讲义,更为具体的可参看 《统计分析与SPSS的应用》薛薇 编著 人大出版社,2002.7第二次印刷
非参数检验的概念
是指在总体不服从正态分布且分布情况 不明时,用来检验数据资料是否来自同 一个总体假设的一类检验方法。由于这 些方法一般不涉及总体参数故得名。 这类方法的假定前提比参数性假设检验 方法少的多,也容易满足,适用于计量 信息较弱的资料且计算方法也简单易行, 所以在实际中有广泛的应用。
12.1 卡方检验 Chi-Square test
这否有同样比例或者等于你所想象的比例(如 5:4:1) 实例1:掷骰子300次,变量LMT,1、2、3、4、5、 6分别代表六面的六个点,试问这骰子是否均匀。数据 data12-01(300个cases)。
Test Variable:一等品 Test Proportion:0.9 比较有用的结果:两组个数和sig=.193>0.5,不能拒绝零假
设,认为该批产品的一等品率达到了90% 。
12.3 游程检验Runs test
单样本变量随机性检验是对某变量值出现是否随机进行
检验。
实例1(同二项分布检验) :掷一枚比赛用的挑边器
非参数检验的过程
1. Chi-Square test 卡方检验 2. Binomial test 二项分布检验 3. Runs test 游程检验 4. 1-Sample Kolmogorov-Smirnov test 一个样本 柯尔莫哥洛夫-斯米诺夫检验 5. 2 independent Samples Test 两个独立样本检验 6. K independent Samples Test K个独立样本检验 7. 2 related Samples Test 两个相关样本检验 8 . K related Samples Test 两个相关样本检验
Test Variable:死亡日期 Expected Values: 2.8:1:1:1:1:1:1 比较有用的结果:sig=.256>0.5,不能拒绝零假设,认为心
脏病人猝死人数与日期的关系为2.8:1:1:1:1:1:1 。
12.2 二项分布检验 Binomial test
二项分布:在现实生活中有很多的取值是两类的,如人 群的男和女、产品的合格和不合格、学生的三好学生和 非三好学生、投掷硬币的正面和反面。这时如果某一类 出现的概率是P,则另一类出现的概率就是1-P。这种 分布称为二项分布。 实例1:掷一枚比赛用的挑边器31次,变量tbh,1为 出现A面、2为出现A面,试问这挑边器是否均匀。数据 data12-03(31个cases)。
补充:二项分布检验实例
实例:为验证某批产品的一等品率是否达到90%,现 从该批产品中随机抽取23个样品进行检测,结果有19 个一等品(1-一等品,0-非一等品)。(变量2个: 一等品和个数,Cases 2个:1 19 和0 4) 加权:Data->Weight Cases:个数 Analyze-> Nonparametric Tests-> Binomial
单样本K-S检验是利用样本数据推断总体是否服从某一理论分布,
适用于探索连续型随机变量的分布形态(判断定距变量的分布情
况):Normal正态分布、Uniform均匀分布、Poisson泊松分布、
Exponential指数分布。
实例 :卢瑟福和盖革作了一个著名的实验,他们观察了长为7.5秒