第7章 SPSS非参数检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方法四:两独立样本的 极端反应检验
基本思想
• 将一组样本作为控制样本,另一组样本作 为实验样本,以控制样本作为对照,检验 实验样本相对于控制样本是否出现了极端 反应。如果实验样本没有出现极端反应, 则认为两总体分布无显著差异;反之则差 异显著。
SPSS
• 具体分析过程: 首先,将两组样本混合按升序排序 然后,求出控制样本的最小秩 Qmin 和最大秩 Qmax,并计算出跨度S= Qmax- Qmin+1 接着, 为消除样本数据中极端值对分析结果 的影响,计算跨度之前可按比例去除控制 样本中部分靠近两端的样本值,然后再求 跨度,得到截头跨度。
SPSS
二项分布检验的基本操作与应用 (以产品合格率.sav为例) 分析
非参数检验
二项式
SPSS
输入检 验概率 值
SPSS
SPSS
由于概率P大于0.05, 所以不能拒绝原假设, 即认为一级品率不低 于0.9
SPSS 概念
单样本K-S检验
• K-S检验(Kolmogorow-Smirnov),该方法 能够利用样本数据推断样本来自总体是否 与某一个理论分布有显著差异,是一种拟 合优度的检验方法,适用于探索连续型随 机变量的分布。
1 U mn 2 1 mn(m n 1) 12
SPSS
统计决策 • 在小样本下,依据U统计量的概率P值进行决策; 在大样本下,则依据Z统计量的概率P值进行决策。 • 若概率P值小于显著性水平 ,则拒绝原假设, 即认为样本来自的两总体分布存在显著差异;反 之,则差异不显著。
具体计算举例以课本P199页数据为例
SPSS 曼-惠特尼U检验 K-S检验 方法 w-w游程检验 极端反应检验
方法一:两独立样本的曼-惠特尼 SPSS U检验
基本思想 • 概念 通过对两组独立样本平均秩的研究来推断 它们来自的两个总体分布有无显著差异。 • 检验的基本步骤 首先将两组样本数据(X1,X2,…Xn)和 ( Y1,Y2,…Yn )混合并按升序排序,得到 每个数据各自的秩Ri
SPSS
基本思想
将总体的取值范围分成有限个互不相容的子集, 从总体中抽取一个样本,考察样本观察值落到每个 子集中的实际频数,并按假设的总体分布计算每个 子集的理论频数,最后根据实际频数和理论频数的 差构造卡方统计量,即
当原假设成立时,统计量服从卡方分布。以此来检 验假设总体的分布是否成立。
( fi fi ) 0 fi i 1
方法二:两独立样本K-S检验
基本思想
• 概念 K-S检验不仅能够对单个总体的分布是否与 某一理论分布存在显著差异进行检验,还 可以对两个总体的分布是否存在差异进行 检验
SPSS • 基本思想同前面单样本K-S检验,但也有些 不同,就是分析的对象是变量值的秩。 • 基本步骤 首先,将两组样本混合并按升序排序 然后,分别计算两组样本秩的累计频数和累 计频率。 最后,计算两组累计频率的差,得到秩的差 值序列并得到D统计量,根据D统计量得出 的概率P与显著性水平大小进行比较判断。
SPSS
第一节单样本的非参数检验
总体分布的卡方检验 二项分布检验 单样本K-S检验 变量值随机性检验
SPSS
总体分布的卡方检验
概念
总体分布的卡方检验是一种对总体分布 进行检验的极为典型的非参数检验方法。 eg:在一个正20面体的各面上分别标有 0~9十个数字,每个数字在两个面上标出。 若把该20面体投掷一些次数后,若检验每 个数字出现的概率是否大致相同,则需用 卡方检验。
1 U1 WX m(m 1) 2
U 2 WY n(n 1) 2
SPSS
计算曼-惠特尼U统计量, • 小样本下,U统计量服从Mann-Whitney分布 即 1 U min(U1 ,U 2 ) W k (k 1) 2 • 大样本下,U统计量近似服从正态分布
Z
SPSS
第三节多独立样本的非参数检验
四城市周岁儿童身高样本数据
中位数检验 Kruskal-Wallis检 验 JonckheereTerpstra检验
城市 身高样本数据 北京 79,75,78,76, 72 上海 72,71,74,74, 73 成都 76,78,78,77, 75 广州 70,72,71,71, 69
SPSS
根据游程数计算Z统计量
2n1n2 r 1 n1 n2 2n1n2 (2n1n2 (n1 n2 )) (n1 n2 ) 2 (n1 n2 1)
Z
最后,进行统计决策。
两独立样本的游程检验SPSS的基本操作 SPSS
(以两独立样本-使用寿命为例)
SPSS
SPSS
分析
非参数检验
1-样本K-S
SPSS
SPSS
正态 分布
SPSS
SPSS
由于概率P大于 0.05,所以不能拒 绝原假设,即认为 周岁儿童身高的总 体分布与正态分布 无显著差异
P-P图
SPSS
SPSS
Q-Q图
SPSS
单样本K-S检验的基本操作与应用举例 以储户存款金额总体的分布检验为例
SPSS
SPSS 正态分布 均匀分布
理论分布类型
指数分布 泊松分布
SPSS
基本思想
在原假设成立的前提下,计算各样本观测值在理 论分布中出现的理论概率值F(x) 计算各样本观测值的实际累计概率值S(x);计 算实际累计概率值与理论累计概率值的差S(x) - F(x) 计算差值序列中的最大绝对差值,即 D max( S ( xi ) F ( xi ) ) 修正的D为 D max(max( S ( x ) F ( x ) ))
SPSS
第7章 SPSS非参数检验
前面进行的假设检验和方差分析, 大都是在数据服从正态分布或近似地服 从正态分布的条件下进行的。但是如果 总体的分布未知,如何进行总体参数的 检验,或者如何检验总体服从一个指定 的分布,都可以归结为非参数检验方法。
SPSS
本章主要内容
单样本的非参数检验 两独立样本非参数检验 两配对样本非参数检验 多独立样本非参数检验 多配对样本非参数检验
SPSS
应用举例(以城镇和农村储户存款 SPSS 金额比较为例 )
SPSS
SPSS
SPSS 双样本
Kolmogorov-Smirnov 检验
SPSS
Wald-Wolfowitz 检验
SPSS
练习题
• 现有数据关于患者服用两种不同安眠药后 睡眠时间延长情况,请用四种不同方法来 检验两种不同安眠药对睡眠时间延长分布 是否有显著差异?
2n1n2 ur n1 n2
r
r
r
2
2n1n2 (2n1n2 n1 n2 ) (n1 n2 ) 2 (n1 n2 1)
SPSS
变量值随机性检验的SPSS操作 以耐电压值.sav为例
SPSS
SPSS
因为概率P 值大于 0.05,所 以不能拒 绝原假设, 即认为该 设备是正 常工作的
SPSS
SPSS
因为卡方对应的概率P值大于0.05, 所以差异不显著,即认为样本来自的总体
SPSS
二项分布检验
概念
SPSS的二项分布检验正是通过样本数 据检验样本来自的总体是否服从指定概率 值为P的二项分布,其原假设为样本来自的 总体与指定的二项分布无显著差异。
SPSS
基本思想
SPSS二项分布检验,在小样本中采用精确检验 方法,对于大样本则采用近似检验方法。精确 检验方法计算n次试验中成功出现的次数小于等 x 于x次的概率,即
SPSS
4.现有抛掷一枚硬币66次所得结果保存在数 据文件硬币结果.sav中,请检验该实验是否 是随机性实验。
SPSS
第二节两独立样本的非参数检验
概念
• 如果两个无联系总体的分布是未知的,则 检验两个总体的分布是否有显著差异的方 法是一种非参数检验方法,或者称为两个 独立样本的检验。检验是通过两个总体中 分别抽取的随机样本数据进行的。
2 k 0
e 2
SPSS
• 决策情况: 2 如果 的概率 P ,则应拒 绝原假设,即认为样本来自的总体分布 与期望分布或某一理论分布存在显著差 异;反之,则不存在显著差异。
SPSS
基本操作及应用举例 (以心脏病猝死.sav为例)
分析
非参数检验
卡方
SPSS
SPSS
输入检验 变量
输入理论(期 望)分布值
SPSS 1.在一个正20面体的各面上分别标出0~9个数 字,每个数字在两个面上标出,现将它投掷 805次,得出各数字朝上的次数。数据放在 Frequncy.sav文件中,试检验其均匀性。 2.试着检验抛硬币实验中,正面出现的概率 是否为1/2.数据在硬币结果.sav中。
练习
3.试着检验10个电子元件的使用寿命分布是 否服从指数分布?数据在电子元件使用寿 命.sav中。
SPSS
中位数检验
基本思想
• 概念:通过对多组独立样本的分析,检验 它们来自的总体的中位数是否存在显著差 异。 • 基本思想:如果多个总体的中位数没有显 著差异,那么这个共同的中位数应在各样 本组中均处在中间位置上。
SPSS
• 分析步骤: 首先,将多组样本混合按升序排序,并求出混合样 本的中位数。 然后,分别计算各组样本中大于和小于上述中位数 的样本个数,形成列联表。 接着,利用卡方检验方法分析各组样本来自的总体 对于上述中位数的分布是否一致。如果各组中大 于(或小于)上述中位数的样本比例大致相同, 则可认为多组样本有共同的中位数,它们来自的 总体的中位数没有显著差异。反之,则有显著差 异。 最后,进行统计决策。
P{ X x} Cn i p i q n i
i 0
在大样本下,采用近似检验,用Z检验统计量, 即
x 0.5 np Z np(1 p)
SPSS
决策情况: 如果上述两种情况下的概率 P值小 于显著性水平 ,则应拒绝原假设, 即认为样本来自的总体分布与指定的 二项分布存在显著差异;反之,则不 存在显著差异。
曼-惠特尼U检验SPSS基本操作 SPSS
(以两独立样本使用寿命为例)
分析
非参数检验
2个独立样本
SPSS
SPSS
由于本题中 涉及是小样 本,因此采 用U检验,相 应概率为精 确概率,由 于0.04小于 0.05,所以 拒绝原假设, 所以认为两 种工艺下产 品使用寿命 的分步存在 显著差异
SPSS
பைடு நூலகம்PSS
极端反应注重对跨度和截头跨度的分析。针对跨度 或截头跨度计算的H检验统计量为:
H (Qi Q )
i 1 m 2
小样本下,H统计量服从Hollander分布;大样本下, H统计量近似服从正态分布。 最后,进行统计决策。
SPSS
两独立样本的极端反应检验SPSS的基本操作 (以两独立样本-使用寿命为例)
SPSS
分别对两组样本的秩求平均,得到两个平均秩 Wx/m和WY/m,然后比较它们的大小,若差值较大, 说明原假设很可能不成立。 计算两个样本各自优先于对方的秩的个数U1、U2, 即 1
然后对U1、U2大小进行比较,若它们相差较大时, 则有必要怀疑原假设的真实性。 计算WilcoxonW统计量,其为上述U1、U2较小 者所对应的秩和
概率P小于0.05,所以拒绝原 假设,即认为储户存款金额总 体分布不服从正态分布
SPSS
变量值随机性检验
基本思想
概念:通过对样本变量值的分析,实现对总体 变量值出现是否随机进行检验。 基本思想:利用游程大小进行判断。 游程是指变量值序列中连续出现相同的值的 次数 检验统计量: r u
Z
其中,
i i
D max( S ( xi 1 ) F ( xi ) )
SPSS
• 决策情况: 如果D统计量的概率 P值小于显著 性水平 ,则应拒绝原假设,即认 为样本来自的总体分布与指定的分布 存在显著差异;反之,则不存在显著 差异。
SPSS
单样本K-S检验的基本操作与应用举例 以儿童身高.sav为例
两独立样本K-S检验SPSS基本操作
SPSS
(以两独立样本-使用寿命为例)
SPSS
SPSS
方法三:两独立样本的游程检验
基本思想
• 该方法的基本思想与单样本游程检验的基本相同, 不同的是计算游程数的方法。两独立样本的游程 数依赖于变量的秩。 首先,将两组样本混合并按升序排序,在变量值排 序的同时,对应的组标记值也会随之重新排列 然后,对组标记值序列按前面的计算游程的方法进 行计算游程数。若游程数较少,则说明两总体有 较大差异。反之,则差异不大。