第五讲 非参数检验
合集下载
第5讲 非参数检验.ppt
2·Kolmogorov-Smirnov Z双样本检验理论方法 Kolmogorov-Smimov Z双样本检验与Kolmogorov-Smimov单样 本检验相似,这种双样本检验涉及两个累积分布间的一致性。单 样本检验涉及一组样本值分布和某一特定理论分布之间的一致性, 双样本检验则涉及两组样本值之间的一致性。
非参数统计检验是一种这样的检验,其模型对于被抽样总体的 参数不规定条件,即非参数检验是不依棘总体分布的统计检验 方法,是指在总体不服从正态分布且分布情况不明时,用来检 验数据资料是否来自同一个总体假设的一类检验方法。
一、单样本非参数检验
单样本非参数统计检验方法可以检验只需抽取一个样本的假设。 该检验是检验某特定样本是否来自于某指定的总体。
Close
配对资料的符号秩和检验 (Wilcoxon配对法)
Close
例6-1 某医院对12例患者进行“巩 膜瓣下灼烙角膜咬切术”,手术前后的 视力如表6-1,问手术后视力是否有改 善?
Close
病人编号 (1) 1 2 3 4 5 6 7 8 9 10 1 4.1 4.5 4.7 4.0 4.1 5.2 4.1 4.1 4.8
Close
Close
本例是检验均匀分布的。 Close
Close
H 0: 20 2 22 /2(n 1 )或 21 /2 2(n 1 ) 也 就 是 P (22 /2(n 1 )) =/ 2 P (2 C lo1 s e/2 2(n 1 ))= /2
二、二项检验 对于任意的两类总体,如果已知其中一类事件所占的比例为P, 那么另一类所占的比例为1-P,
Close
Close
Close
Close
Close
Close
非参数统计检验是一种这样的检验,其模型对于被抽样总体的 参数不规定条件,即非参数检验是不依棘总体分布的统计检验 方法,是指在总体不服从正态分布且分布情况不明时,用来检 验数据资料是否来自同一个总体假设的一类检验方法。
一、单样本非参数检验
单样本非参数统计检验方法可以检验只需抽取一个样本的假设。 该检验是检验某特定样本是否来自于某指定的总体。
Close
配对资料的符号秩和检验 (Wilcoxon配对法)
Close
例6-1 某医院对12例患者进行“巩 膜瓣下灼烙角膜咬切术”,手术前后的 视力如表6-1,问手术后视力是否有改 善?
Close
病人编号 (1) 1 2 3 4 5 6 7 8 9 10 1 4.1 4.5 4.7 4.0 4.1 5.2 4.1 4.1 4.8
Close
Close
本例是检验均匀分布的。 Close
Close
H 0: 20 2 22 /2(n 1 )或 21 /2 2(n 1 ) 也 就 是 P (22 /2(n 1 )) =/ 2 P (2 C lo1 s e/2 2(n 1 ))= /2
二、二项检验 对于任意的两类总体,如果已知其中一类事件所占的比例为P, 那么另一类所占的比例为1-P,
Close
Close
Close
Close
Close
Close
第5讲SPSS非参数检验
二、操作
数据文件:“糖果中的卡路里.sav” 菜单:“分析→非参数检验→旧对话框→K个独立样本”
多独立样本非参数检验整体分析与设计的内容
输入最大值、 最小值。
Kruskal-Wallis H检 验:是曼-惠特尼U 检验在多个独立样 本下的推广。
检验各个样本是否来自有相同中位数的 总体。--- 这种检验的效能最低。
2)对数据的测量尺度无约束,对数据的要求也不严格,任何数据类型 都可以。
3)适用于小样本、无分布样本、数据污染样本、混杂样本等。
注:若参数检验模型的所有假设在数据中都能满足,而且测量达到了所 要求的水平,那么,此时用非参数检验就浪费了数据。
因此,若所需假设都满足的情况下,一般就选择参数检验方法。
卡方检验
此时,零假设:两总体的 均值无显著性差异;就可 能不成立。
K-S检验。以变量的秩 作为分析对象;而非变 量值本身。
也需要先将两组样本混 合、升序排列。
两独立样本非参数检验整体分析与设计的内容 二、操作
该检验有特定用途,给出的结果均为单侧 检验。若施加的处理时的某些个体出现正 向效应,而另一些个体出现负向效应时, 就应当采用该检验方法。 基本思想为:将一组样本作为控制样本, 另一组作为试验样本。以控制样本为对照, 检验试验样本相对于控制样本是否出现了 极端反应。若无极端反应,则认为两总体 分布无显著性差异;否则,有显著性差异。
选择分布
“结”的处理
单样本K-S检验
整体分析与设计的内容
三、补充描述性统计的P-P图和Q-Q图
P-P图的输出样子: P-P图
期望(理论)累计 概率值
去势P-P图
样本数据实际累计 概率值
实际与期望的差值
样本数据实际累计 概率值
数据文件:“糖果中的卡路里.sav” 菜单:“分析→非参数检验→旧对话框→K个独立样本”
多独立样本非参数检验整体分析与设计的内容
输入最大值、 最小值。
Kruskal-Wallis H检 验:是曼-惠特尼U 检验在多个独立样 本下的推广。
检验各个样本是否来自有相同中位数的 总体。--- 这种检验的效能最低。
2)对数据的测量尺度无约束,对数据的要求也不严格,任何数据类型 都可以。
3)适用于小样本、无分布样本、数据污染样本、混杂样本等。
注:若参数检验模型的所有假设在数据中都能满足,而且测量达到了所 要求的水平,那么,此时用非参数检验就浪费了数据。
因此,若所需假设都满足的情况下,一般就选择参数检验方法。
卡方检验
此时,零假设:两总体的 均值无显著性差异;就可 能不成立。
K-S检验。以变量的秩 作为分析对象;而非变 量值本身。
也需要先将两组样本混 合、升序排列。
两独立样本非参数检验整体分析与设计的内容 二、操作
该检验有特定用途,给出的结果均为单侧 检验。若施加的处理时的某些个体出现正 向效应,而另一些个体出现负向效应时, 就应当采用该检验方法。 基本思想为:将一组样本作为控制样本, 另一组作为试验样本。以控制样本为对照, 检验试验样本相对于控制样本是否出现了 极端反应。若无极端反应,则认为两总体 分布无显著性差异;否则,有显著性差异。
选择分布
“结”的处理
单样本K-S检验
整体分析与设计的内容
三、补充描述性统计的P-P图和Q-Q图
P-P图的输出样子: P-P图
期望(理论)累计 概率值
去势P-P图
样本数据实际累计 概率值
实际与期望的差值
样本数据实际累计 概率值
第五讲 非参数检验
采用非参数检验方法进行检验,判断四个城 市周岁儿童的身高分布是否存在显著差异
多独立样本的非参数检验
操作演示
多独立样本的非参数检验
多独立样本的非参数检验
Kruskal-Wallis检验
多独立样本的非参数检验
Kruskal-Wallis检验结果 概率P值(0.003)小于显 著性水平α(0.05),因此 应该拒绝原假设,可以认为 四个城市周岁儿童的身高分 布存在显著差异
卡方检验
卡方检验方法可以根据样本数据,推断总 体分布与期望分布或某一理论分布是否存 在显著差异
卡方检验
卡方检验基本思想的理论依据
如果从一个随机变量X中随机抽取若干个观 察样本,这些观察样本落在X的k个互不相干 的子集中的观察频数服从一个多项分布,该 多项分布当k趋于无穷时近似服从卡方分布
卡方检验 二项分布检验 单样本K-S检验
掌握和熟悉两独立样本K-S检验的操作步骤 掌握和熟悉多独立样本Kruskal-Wallis检验的 操作步骤
课堂练习2
利用第2章第6题的数据(居民储蓄调查数 据.sav),分析存款金额的总体分布与正 态分布是否存在显著差异
课堂练习3
某店铺老板认为一周七天中光临店铺的顾客数 量相同,现随机收集某一周七天的顾客数量如 下,请检验一周内各日的顾客人数是否相同
课堂练习1——关键点
一 11
二 19
三 17
检验结果
概率P值(0.344)大于显著性水平α(0.05),因 此不能拒绝原假设,可以认为周岁儿童的总体分布 与正态分布无显著差异
Normal:正态分布 Uniform:均匀分布 Poisson:泊松分布 Exponential: 指数分布
非参数验课件
秩次和秩和
“秩”即按数据大小排定的次序号,又称秩次号。编秩 就是将观察值按顺序由小到大排列,并用序号代替原始 变量值本身。用秩次号代替原始数据后,所得某些秩次 号之和,即按某种顺序排列的序号之和,称为秩和。设 有以下两组数据:
A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7
•编秩后,按差值的正负给秩次冠上符号。
分析步骤:
(3)求差值为正或负的秩和 差值为正的秩和以T+表示 差值为负的秩和以T-表示。 T++T-=n(n+1)/2 T=min(T+,T-)
(4)确定P值和作出推断结论:
当n≤50时,查T界值表
T在界值范围内
P>α
T在界值范围外或相等 P<α
例1 临床某医生研究白癜风病人的白介素IL6水平(u/l)在白斑部位与正常部位有无差异 ,调查的资料如表1所示:
表2 尿氟含量X(1)
2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 2.99 3.19 3.37 4.57
12名工人尿氟含量测定的结果 差值d=X-2.15 (2) 0 -0.05 0.05 -0.03 0.27 0.37 0.47 0.57 0.84 1.04 1.22 2.42
对总体的分布类型 不作任何要求
不受总体参数的影响, 比较分布或分布位置 适用范围广;可用于任 何类型资料(等级资料, 或“>50mg” )
参数检验与非参数检验比较
参数检验 要求资料服从 某种分布
检验效率高
非参检验
1. 对资料的分布没有特殊要求,总体为 偏态、总体分布未知的计量资料(尤 其在n<30的情况)
《非参数检验方法》课件
用于比较两个独立样本的中位数是否相等。
用于比较三个或多个独立样本的中位数是 否相等。
3 Wilcoxon符号秩检验
4 Friedmann检验
用于比较两个相关样本的中位数是否相等。
用于比较三个或多个相关样本的中位数是 否相康型”饮料,是否对销售额产生显著影响?
使用 Mann-Whitney U检验来比较推出“健康型”饮料前后的销售额差异。
案例2:针对不同年龄段顾客的购物偏好是否存在差异?
使用 Kruskal-Wallis H检验来分析不同年龄段顾客的购物偏好是否有显著差异。
总结
非参数检验方法的应用场景和局限性。非参数检验方法的总体流程。非参数 检验方法的意义及应用前景。
《非参数检验方法》PPT 课件
非参数检验方法PPT课件
简介
什么是非参数检验方法?为什么需要非参数检验方法?非参数检验方法的优 势和劣势。
基本原理
什么是假设检验?什么是零假设和备择假设?非参数检验方法与参数检验方 法的区别。
常见的非参数检验方法
1 Mann-Whitney U检验
2 Kruskal-Wallis H检验
非参数检验综合概述PPT(30张)
•
9、别再去抱怨身边人善变,多懂一些道理,明白一些事理,毕竟每个人都是越活越现实。
•
10、山有封顶,还有彼岸,慢慢长途,终有回转,余味苦涩,终有回甘。
•
11、人生就像是一个马尔可夫链,你的未来取决于你当下正在做的事,而无关于过去做完的事。
•
12、女人,要么有美貌,要么有智慧,如果两者你都不占绝对优势,那你就选择善良。
多个独立样本的非参数检验
例3 14名新生儿出生体重按其母亲的吸烟习惯分组(A组: 每日吸烟多于20支;B组:每日吸烟少于20支;C组:过去 吸烟而现已戒烟;D组:从不吸烟),具体如下。试问四个 吸烟组出生体重分布是否相同?数据见npc.sav:
A组: 2.7 2.4 2.2 3.4 B组: 2.9 3.2 3.2 C组: 3.3 3.6 3.4 3.4 D组: 3.5 3.6 3.7
两独立样本的非参数检验 (2) 检验统计量
分析结果
给 出 Mann-Whitney U 、 Wilcoxon W 统 计 量 和 Z 值 , 近 似 值 概 率 (Asymp.Sig)和精确概率值(Exact.sig)均小于0.05,结论一致,表明 猫、兔在缺氧条件下的生存时间的差异具有统计学意义,由平均秩次猫 (15.7)、兔(7.96)来看,可以认为缺氧条件下猫的生存时间长于兔。
•
3、命运给你一个比别人低的起点是想告诉你,让你用你的一生去奋斗出一个绝地反击的故事,所以有什么理由不努力!
•
4、心中没有过分的贪求,自然苦就少。口里不说多余的话,自然祸就少。腹内的食物能减少,自然病就少。思绪中没有过分欲,自然忧就少。大悲是无泪的,同样大悟无言。缘来尽量要惜,缘尽就放。人生本来就空,对人家笑笑,对自己笑笑,笑着看天下,看日出日落,花谢花开,岂不自在,哪里来的尘埃!
非参数检验
➢ 编秩:数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重(kg)xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验 (Friedman test)
正态近似法
如果n1或n2-n1超出附表的范围,可按下式 计算u值:
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时,应用下式进行校正:
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料(或等级资料)两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分 差 值
非参检验ppt课件
由于延长的时数的分布不明,我们考虑用非参数检验 ! Mann-Whitney U 类似于t检验。
两相关样本非参数检验例题
为研究长跑对增强心功能的效果,对15名男生进行实 验,经过5个月的长跑锻炼后看其晨脉是否减少,锻炼前 后的晨脉数据如下:
锻 炼 前 7 0 7 6 5 6 6 3 6 3 5 6 5 8 6 0 6 5 6 5 7 5 6 6 5 6 5 9 7 0 锻 炼 后 4 8 5 4 6 0 6 4 4 8 5 5 5 4 4 5 5 1 4 8 5 6 4 8 6 4 5 0 5 4
由于数据太少,难以保证正态性,考虑用非参 数检验。
多个独立样本非参数检验例2
分别从四个学校选出一部分人组成本校代 表队参加物理竞赛,结果如后,问四所 学校成绩有无显著差异?
学校
竞赛成绩
A 80 88 87 87 90 88 85
B 99 91 98 98 99 96 92 98
C 89 82 81 80 86 86 86 84
非参数检验
非参数检验是与参数检验相对应的,参数
检验指的是在总体分布已知,满足某些 假定条件(独立性、方差齐性等),检验的 数据一般为连续数据的情况下进行的检 验。如果有些条件不能满足, 则采用非参 数检验,可以根据实际情况采用如下一 些方法进行检验, 这些检验都是在 Nonparametric tests菜单项里执行。
Npar
两均值比 相 独较关 立样 样中 符 符 秩 本 本数 号 号 和检 等 检 检验 级 验 验 (((M SM法 检 法 法 iega()dW nn验 in)iaWl法 nchoixt)noUen)y 多均值比 随 完较机 全区 随::弗 组 克 机里 瓦德 氏曼 方方 差差 (分 (KF分 rr析 ui es析 dkam a)nladWnallH i s)
两相关样本非参数检验例题
为研究长跑对增强心功能的效果,对15名男生进行实 验,经过5个月的长跑锻炼后看其晨脉是否减少,锻炼前 后的晨脉数据如下:
锻 炼 前 7 0 7 6 5 6 6 3 6 3 5 6 5 8 6 0 6 5 6 5 7 5 6 6 5 6 5 9 7 0 锻 炼 后 4 8 5 4 6 0 6 4 4 8 5 5 5 4 4 5 5 1 4 8 5 6 4 8 6 4 5 0 5 4
由于数据太少,难以保证正态性,考虑用非参 数检验。
多个独立样本非参数检验例2
分别从四个学校选出一部分人组成本校代 表队参加物理竞赛,结果如后,问四所 学校成绩有无显著差异?
学校
竞赛成绩
A 80 88 87 87 90 88 85
B 99 91 98 98 99 96 92 98
C 89 82 81 80 86 86 86 84
非参数检验
非参数检验是与参数检验相对应的,参数
检验指的是在总体分布已知,满足某些 假定条件(独立性、方差齐性等),检验的 数据一般为连续数据的情况下进行的检 验。如果有些条件不能满足, 则采用非参 数检验,可以根据实际情况采用如下一 些方法进行检验, 这些检验都是在 Nonparametric tests菜单项里执行。
Npar
两均值比 相 独较关 立样 样中 符 符 秩 本 本数 号 号 和检 等 检 检验 级 验 验 (((M SM法 检 法 法 iega()dW nn验 in)iaWl法 nchoixt)noUen)y 多均值比 随 完较机 全区 随::弗 组 克 机里 瓦德 氏曼 方方 差差 (分 (KF分 rr析 ui es析 dkam a)nladWnallH i s)
非参数检验
本例n=11,T=11.5,查附表9,得双侧0.05<P<0.10,按 =0.05水准不拒绝H0,尚不能认为两法测谷-丙转氨酶结果有差 别。
若n>50,超出附表9的范围,可用正态近似法作u检验,按 下式计算u值。
对秩的差值,省略所有差值为0的对子数,令余下的有效对子数
为n;最后按n个差值编正秩和负秩,求正秩和或负秩和。但对 于等级资料,相同秩多,小样本的检验结果会存在偏性,最好 用大样本。
的多个独立样本所来自的多个总体分布是否有差别。在理论
上检验假设H0应为多个总体分布相同,即多个样本来自同一 总体。由于H检验对多个总体分布的形状差别不敏感,故在实
际应用中检验假设H0可写作多个总体分布位置相同。对立的
备择假设H1为多个总体分布位置不全相同。
1.原始数据的多个样本比较
方法步骤见例8-5.
样本所来自的两个总体中位数是否有差别。方法步骤见例8l。
例8-1 对12份血清分别用原方法(检测时间20分钟)和新 方法(检测时间10分钟)测谷-丙转氨酶,结果见表8-1的(2)、 (3)栏。问两法所得结果有无差别?
血清谷-丙转氨酶不知是否符合正态分布,本例为小样 本资料,其配对差值经正态性检验得0.1<P<0.2,虽可用配对t 检验,为保守起见,现用Wilcoxon符号秩检验。
用于推断计量资 料或等级资料的两个独立样本所来
自的两个总体分布是否有差别。
在理论上检验假设H0应为两个总体分布相同,即 两个样本来自同一总体。由于秩和检验对于两个总体分布 的形状差别不敏感,对于位置相同形状不同但类似的两个 总体分布,如均数相等、方差不等的两个正态分布,推断
不出两个总体分布(形状)有差别,故对立的备择假设Hl不
若n>50,超出附表9的范围,可用正态近似法作u检验,按 下式计算u值。
对秩的差值,省略所有差值为0的对子数,令余下的有效对子数
为n;最后按n个差值编正秩和负秩,求正秩和或负秩和。但对 于等级资料,相同秩多,小样本的检验结果会存在偏性,最好 用大样本。
的多个独立样本所来自的多个总体分布是否有差别。在理论
上检验假设H0应为多个总体分布相同,即多个样本来自同一 总体。由于H检验对多个总体分布的形状差别不敏感,故在实
际应用中检验假设H0可写作多个总体分布位置相同。对立的
备择假设H1为多个总体分布位置不全相同。
1.原始数据的多个样本比较
方法步骤见例8-5.
样本所来自的两个总体中位数是否有差别。方法步骤见例8l。
例8-1 对12份血清分别用原方法(检测时间20分钟)和新 方法(检测时间10分钟)测谷-丙转氨酶,结果见表8-1的(2)、 (3)栏。问两法所得结果有无差别?
血清谷-丙转氨酶不知是否符合正态分布,本例为小样 本资料,其配对差值经正态性检验得0.1<P<0.2,虽可用配对t 检验,为保守起见,现用Wilcoxon符号秩检验。
用于推断计量资 料或等级资料的两个独立样本所来
自的两个总体分布是否有差别。
在理论上检验假设H0应为两个总体分布相同,即 两个样本来自同一总体。由于秩和检验对于两个总体分布 的形状差别不敏感,对于位置相同形状不同但类似的两个 总体分布,如均数相等、方差不等的两个正态分布,推断
不出两个总体分布(形状)有差别,故对立的备择假设Hl不
非参数检验教学课件
如果多个配对样本得分布存在显著得差异, 那么数值普遍偏大得组秩和必然偏大,数值普 遍偏小得组,秩和也必然偏小,各组得秩之间就 会存在显著差异。如果各样本得平均秩大致相 当,那么可以认为各组得总体分布 没有显著差 异。
2、多配对样本得Kendall协同系数检验
多配对样本得Kendall协同系数检验和 Friedman检验非常类似,也就是一种多配对样 本得非参数检验,但分析得角度不同。多配对 样本得Kendall协同系数检验主要用在分析评 判者得判别标准就是否一致公平方面。她将每 个评判对象得分数都看作就是来自多个配对总 体得样本。一个评判对象对不同被判定对象得 分数构成一个样本,其零假设为:样本来自得多 个配对总体得分布无显著差异,即评判者得评 判标准不一致。
非参数检验教学课件
但许多调查或实验所得得科研数据,其总 体分布未知或无法确定。因为有得数据不就是 来自所假定分布得总体,或者数据根本不就是 来自一个总体,还有可能数据因为某种原因被 严重污染,这样在假定分布得情况下进行推断 得做法就有可能产生错误得结论。此时人们希 望检验对一个总体分布形状不必作限制。
非参数检验根据样本数目以及样本之间得关系 可以分为单样本非参数检验、两独立样本非参数检 验、多独立样本非参数检验、两配对样本非参数检 验和多配对样本非参数检验几种。
6、1 SPSS单样本K-S检验
6、1、1 统计学上得定义和计算公 式 定义:单样本K-S检验就是以两位前苏联数
学家Kolmogorov和Smirnov命名得,也就是一种 拟合优度得非参数检验方法。单样本K-S检验 就是利用样本数据推断总体就是否服从某一理 论分布得方法,适用于探索连续型随机变量得 分布形态。
Kendall协同系数检验中会计算Friedman 检验方法,得到friedman统计量和相伴概率。 如果相伴概率小于显著性水平,可以认为这10 个节目之间没有显著差异,那么可以认为这5个 评委判定标准不一致,也就就是判定结果不一 致。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
单样本K-S检验
实际问题应用举例
单样本K-S检验
操作演示
收集到21名周岁儿童身高的样本数据,分析 周岁儿童身高的总体是否服从正态分布
儿童身高.sav
单样本K-S检验
选择待检验变量:周岁儿童的身高 在Test Distribution框中选择理论分布
单样本K-S检验
单样本的非参数检验
实际问题应用举例
医学家在研究心脏病人猝死人数与日期的关 系时发现:一周之中,星期一心脏病人猝死 者较多,其他日子则基本相当。各天的比例 近似2.8:1:1:1:1:1:1.现收集到心脏病人死 亡日期的样本数据,推断其总体分布是否与 上述理论分布相吻合
在这个问题中,死亡日期是“定序型数据”, 对该类问题的总体分布检验往往采用卡方检验
二项分布检验
实际问题应用举例
从某批产品中随机抽取23个样品进行检测并 得到检验结果数据。用1表示一级品,用0表 示非一级品。根据抽样结果验证该批产品的 一级品率是否为90%
二项分布检验
操作演示
二项分布检验
在Define Dichotomy框中指定如何分类。如果检验变量 是二分变量,则选中Get from data选项 SPSS将自动将第一组作为检验类,检验该类出现的概率 是否与输入的检验概率存在显著差异
卡方检验
卡方检验方法可以根据样本数据,推断总 体分布与期望分布或某一理论分布是否存 在显著差异
卡方检验
卡方检验基本思想的理论依据
如果从一个随机变量X中随机抽取若干个观 察样本,这些观察样本落在X的k个互不相干 的子集中的观察频数服从一个多项分布,该 多项分布当k趋于无穷时近似服从卡方分布
两独立样本的非参数检验
操作演示
目的:通过非参数检验方法,判断它们的分 布是否存在显著差异,进而对两种工艺的优 劣进行评价
两独立样本的非参数检验
两独立样本的非参数检验
K-S检验结果
待检验的变量 组标记值 K-S检验方法
概率P值(0.037)小于显 著性水平α(0.05),因此 应该拒绝原假设,可以认为 甲乙两种工艺下产品使用寿 命的分布存在显著差异
2.8:1:1:1:1:1:1
卡方检验
检验结果
二项分布检验
在现实生活中有很多数据的取值是二分的,通 常这些二分数据分别用1和0表示
卡方统计量观测值对 应的概率P值(0.256 )大于显著性水平α (0.05) 接受原假设,可以认 为心脏病人死亡日期 的实际分布与理论分 布2.8:1:1:1:1:1:1 无显著差异
统计分析与SPSS应用
丁婉玲 wld@
第五讲 非参数检验
丁婉玲 wld@
非参数检验
非参数检验是统计分析方法的重要组成部 分,它与参数检验共同构成统计推断的基 本内容 非参数检验是在总体不服从正态分布且分 布不明时,利用样本数据对总体分布形态 进行推断 由于非参数检验方法在推断过程中不涉及 有关总体分布的参数,因此称为“非参数 ”检验
检验结果
概率P值(0.344)大于显著性水平α(0.05),因 此不能拒绝原假设,可以认为周岁儿童的总体分布 与正态分布无显著差异
Normal:正态分布 Uniform:均匀分布 Poisson:泊松分布 Exponential: 指数分布
课堂练习1
某地某一时期内出生35名婴儿,其中女性19名(Sex=0 ),男性16名(Sex=1)。请问这个地方出生婴儿性别比 与通常的男女性别比例(0.5)是否不同
课堂练习4
利用第2章第6题的数据(居民储蓄调查数 据.sav),分析不同常住地人群本次存款 金额的总体分布是否存在显著差异
课堂练习5
利用第2章第6题的数据(居民储蓄调查数 据.sav),分析不同收入人群本次存款金 额的总体分布是否存在显著差异
要点小结
了解非参数检验的目的和前提 掌握和熟悉单样本非参数检验的操作步骤
产品合格率.sav
数据编辑窗口中的第一条数据所在组为第一组
二项分布检验
检验结果
单样本K-S检验
K-S检验能够利用样本数据推断样本来自 的总体是否服从某一理论分布,是一种拟 合优度的检验方法,适合探索连续型随机 变量的分布
23个样本中一级品个数小于等于19个的概率 值为0.193,如果显著性水平为0.05,则不 应该拒绝原假设,认为一级品概率与90%无 显著差异
是一种吻合性检验 适用于对有多项分类值的总体分布的分析 原始假设是:样本来自的总体分布与期望分 布或某一理论分布无显著差异
卡方检验对数据存储的要求
定义一个存放变量值的变量 定义一个存放各变量值观测频数的变量
卡方检验
操作演示“心脏病猝死.sav”
卡方检验
选定待检测的变量:死亡日期 设定理论值
例如课堂练习1中
星期一光临店铺的顾客数量为11人,实质上就是 “来店日期”这个变量,取值为1的个案数为11 星期二光临店铺的顾客数量为19人,实质上就是 “来店日期”这个变量,取值为2的个案数为19
加权操作完毕后,数据编辑窗口显示的内 容并不会发生变化
两独立样本的非参数检验
某工厂用甲乙两种不同的工艺生产同一种 产品。如果希望检验两种工艺下产品的使 用寿命的分布是否存在显著差异,可从两 种工艺生产出的产品中随机抽样,得到抽 样数据见“使用寿命.sav”
多独立样本的非参数检验
多独立样本的非参数检验是通过分析多组 独立样本数据,推断样本来自的多个总体 中的中位数或分布是否存在显著差异 多组独立样本是指按独立样本抽样方式获 得的多组样本
多独立样本的非参数检验
希望对北京、上海、成都、广州四个城市 的周岁儿童的身高进行比较分析。采用独 立抽样方式获得四组独立样本。具体数据 见“多城市儿童身高.sav”
婴儿 1 2 3 4 5 6 7 8 9 10 11 12 Sex 1 0 1 1 1 1 0 0 0 0 1 1 婴儿 13 14 15 16 17 18 19 20 21 22 23 24 Sex 1 1 1 1 0 0 0 0 0 0 1 1 婴儿 25 26 27 28 29 30 31 32 33 34 35 Sex 1 1 0 0 0 0 1 0 0 0 0
男性和女性 合格产品和不合格产品 硬币正面和硬币反面
如果进行n次相同的实验,则出现1或0的次数可 用离散型随机变量来描述,那么变量X的分布为 二项分布
如果出现1的概率设为p 则出现0的概率就为1-p
二项分布检验
二项分布检验是要通过样本数据检验样本 来自的总体是否服从指定的概率为P的二 项分布,其原假设是:样本来自的总体与 指定的概率为P的二项分布无显著差异
采用非参数检验方法进行检验,判断四个城 市周岁儿童的身高分布是否存在显著差异
多独立样本的非参数检验
操作演示
多独立样本的非参数检验
多独立样本的非参数检验
Kruskal-Wallis检验
多独立样本的非参数检验
Kruskal-Wallis检验结果 概率P值(0.003)小于显 著性水平α(0.05),因此 应该拒绝原假设,可以认为 四个城市周岁儿童的身高分 布存在显著差异
四 15
五 15
六 16
日 19
问题出在 哪里
卡方检验数据要求——变量加权
卡方检验数据要求——变量加权
变量加权
SPSS中指定的加权变量的过程实质上是变 量的复制
两独立样本的非参数检验
两独立样本的非参数检验是在对总体分布 不甚了解的情况下,通过对两组独立样本 的分析推断样本来自的两个总体的分布是 否存在显著的差异
卡方检验 二项分布检验 单样本K-S检验
掌握和熟悉两独立样本K-S检验的操作步骤 掌握和熟悉多独立样本Kruskal-Wallis检验的 操作步骤
课堂练习2
利用第2章第6题的数据(居民储蓄调查数 据.sav),分析存款金额的总体分布与正 态分布是否存在显著差异
课堂练习3
某店铺老板认为一周七天中光临店铺的顾客数 量相同,现随机收集某一周七天的顾客数量如 下,请检验一周内各日的顾客人数是否相同
பைடு நூலகம்
课堂练习1——关键点
一 11
二 19
三 17