第7章 SPSS 20.0非参数检验

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

③计算跨度
Qmin
Qm ax
④为了消除样本S数 Q据ma中x Q的min极1端值,计算跨度前可按比例(通常 5%)去除控制样本中靠近两端的样本值,再求跨度,得截 头跨度
⑤针对跨度或截头跨度计算H统计量:
m
H (Qi Q )2 i 1
m 控制样本的样本数, Qi 控制样本在混合样本中的秩, Q 控制样本的平均秩
3.应用案例
利用“儿童身高”数据分析周岁儿童身高 总体是否服从正态分布。
分析: 可以通过单样本K-S检验实现。
7.1.4 变量值随机性检验
1.基本思想 (1)通过对样本变量值的分析,实现对总体
的变量值出现是否随机进行检验。
(2)原假设:总体变量值出现是随机的。 ①检验依据:游程-样本序列中连续出现相 同的变量值的次数。
框 (2)分组变量:存放组标志的变量,并通过
“定义组”给出两组的标志值。 (3)检验类型:选择相应的检验方法
7.2.6应用案例
利用“使用寿命”数据,判断两种工艺下 产品的使用寿命的分布是否存在显著差异, 进而对两个工艺的优劣进行判断。
分析: 两个工艺产品的使用寿命可看作两独立样本, 可以通过曼-惠特尼U检验、K-S检验、W-W 游程检验、极端反应检验实现。
Z统计量的p值>显著性水平,不拒绝原假设,变量值的出现是 随机的。
2.实现步骤
分析-非参数检验-旧对话框-游程
(1)选定待检验的变量到“检验变量列表” 框
(2)割点:计算游程数的分界值 ①中位数:样本中位数为分界值
②众数:样本众数为分界值
③均值:样本均值为分界值
④设定:以用户输入的值为分界值,SPSS 将小于该分界值的所有变量作为一组,大 于或等于该分界值的所有变量作为一组, 计算游程。
(2)推断样本来自的两个总体的分布等是否 存在显著差异。
(3)方法:曼-惠特尼U检验、K-S检验、WW游程检验、极端反应检验等。
7.2.1两独立样本的曼-惠特尼U检验
1.基本思想
(1)原假设:两组独立样本来自的两总体分布无显著差 异。
(2)通过两组样本平均秩的研究实现推断
秩-变量值排序的名次,变量值有几个,对应的秩便有 几个。
利用总体分布卡方检验实现。
7.1.2二项分布检验
1.基本思想
(1)通过样本数据检验样本来自的总体是否服从 指定概率p的二项分布。
(2)小样本-精确检验
x
P{X x} Cni piq ni i0
Z x 0.5 np np(1 p)
大样本-近似检验 x 2 时加0.5 x 2 时减0.5
值:依次输入值,通过【添加】、【更改】、【删除】 进行增加、修改和删除。
3.应用案例
医学研究表明心脏病人猝死人数与日期的 关系为:一周内,星期一猝死者较多,其 他日子基本相当,各天的比例近似为:2.8: 1:1:1:1:1:1 根据“心脏病猝死”数据,推断总体分布 是否与理论分布相吻合。
分析:
(3)检验步骤
①将两组样本混合并升序排列,得每个数据的秩 Ri
②分别对样本X和Y的秩求平均,得平均秩WY n 和 WX m ③计算样本X优于样本Y秩的个数 U1和样本Y优于样本
X秩的个数 U2
④依据
U

1
U
2计算WilcoxonW统计量和曼-惠特尼பைடு நூலகம்统
计量。
WilcoxonW统计量:
若m n,则WilconxonW WY 若m n,则WilconxonW WX 若m n,则WilconxonW为第一个变量值所在样本值的W值
第七章 SPSS非参数检验
第七章
本章内容
7.1 单样本的非参数检验 7.2 两独立样本的非参数检验 7.3 多独立样本的非参数检验 7.4 两配对样本的非参数检验 7.5 多配对样本的非参数检验
非参数检验
非参数检验: (1)在总体分布未知或知道甚少的情况下, 利用样本数据对总体分布形态等进行推断 的方法。 (2)推断过程中不涉及有关总体分布的参 数。
3.应用案例
利用“电缆数据”推断耐压设备的工作是 否正常。
分析:
①若耐压数据的变动是随机的-则设备工作正 常
②若耐压数据的变动不是随机的-则设备工作 存在不正常
③可以通过变量值随机性检验实现。
7.2两独立样本的非参数检验
(1)独立样本:在一个总体中随机抽样对在 另一个总体中随机抽样没有影响的情况下 所获得的样本。
7.3多独立样本的非参数检验
1.通过分析多组独立样本数据,推断样本来 自的多个总体的中位数或分布是否存在显 著差异。
2.方法:中位数检验、Kruskal-Wallis检验、 Jonckheere-Terpstra检验。
7.3.1中位数检验
1.基本思想
(1)原假设:多个独立样本来自的多个总体的中位 数无显著差异。
(2)检验步骤
①将多组样本混合升序排列,求混合样本的中位数
②分别计算各组样本中大于和小于中位数的样本个 数,形成列联表(p230 表7-13)
③利用卡方检验分析各组样本来自的总体对中位数 的分布是否一致。
r
2
i
k j 1
(
f
0 ij
fije )2 fije
~
2 ((2 1) (n 1))
②游程数太大或太小都表明变量值存在不 随机的现象
(3)检验统计量
Z r r r:游程数 r
r

2n1n2 n1 n2

2 r

2n1n2 (2n1n2 n1 n2 ) (n1 n2 )2 (n1 n2 1)
n1 出现1的个数,n2 出现0的个数
(4)决策:
Z统计量的p值<显著性水平,拒绝原假设,变量值的出现不是 随机的。
④构造K-W统计量
秩的组间平方和 K W 秩总平方和的平均
12 N (N 1)
k i
ni (Ri R )2 ~ 2 (k 1)(k较大,通常大于3即可)
p :拒绝原假设,两总体的分布有显著差异
p :不拒绝原假设,两总体的分布无显著差异
7.2.3两独立样本的游程检验
1.基本思想 (1)原假设:两组独立样本来自的两总体的分布无显著差异。 (2)检验步骤 ①将两组样本混合并按升序排列,组标记值也随之重新排列 ②计算组标记值序列的游程数 ③根据游程数计算Z统计量,Z统计量近似服从正态分布 (3)决策p :: 拒绝原假设,两总体的分布有显著差异
2.实现步骤 分析 - 非参数检验-旧对话框-卡方检验
(1)选定待检验的变量到“检验变量列表”框 (2)在“期望全距”栏中确定参与分析的观测值的范
围:
从数据中获取:所有观测数据都参与分析 使用指定的范围:只在该取值范围内的观测数据才 参与分析。
(3)期望值:给出各理论值 所有类别相等:所有子集的频数都相同
n
n
2.实现步骤
分析-非参数检验-旧对话框-二项式
(1)选定待检验的变量到“检验变量列表” 框
(2)定义二分法:指定如何分类 从数据中获取:检验变量为二值变量
割点:输入具体数值,大于等于该值的为第 一组,大于该组的为第二组
(3)检验比例:输入二项分布的检验概率值
3.应用案例
利用“产品合格率”数据,推断该批产品 的一级品率是否为90%
曼-惠特尼统计量U为:
U W 1 k (k 1) 2
W Wilcoxon W,k W对应样本组的样本个数
大样本下,U近似服从正态分布
U 1 mn
Z
2
1 mm(m n 1)
12
小样本下依据U统计量和p值进行决策 大样不下依据Z统计量和p值进行决策
p ,拒绝原假设,样本来自的两总体的分布存在显著差异 p ,不拒绝原假设,样本来自的两总体的分布无显著差异
7.1 单样本的非参数检验
1.目的:样本来自总体的分布是否与某个已 知的分布相吻合?
—绘制样本数据的直方图、pp图、QQ图判 断—粗略
—通过非参数检验—精确
2.单样本非参数检验
(1)对单个总体的分布形态等进行推断
(2)方法:卡方检验、二项分布检验、K-S 检验、变量值随机性检验等。
7.1.1总体分布的卡方检验
D max( S(xi ) F(xi ) 由于实际累计概率为离散值,可对D修正为: 修正D : D max(max(S(xi ) F (xi ) , max( S(xi1) F(xi ) )
(4)原假设成立时:
①小样本下:D~kolmogorov分布
②大样本下: nD 近似服从K(x)分布 ③SPSS仅给出大样本下的 nD 和对应的p值 (5)决策
①D统计量的p值<显著性水平,拒绝原假设,样本 来自的总体与指定分布有显著差异
②D统计量的p值>显著性水平,不拒绝原假设,样 本来自的总体与指定分布无显著差异
2.实现步骤
分析-非参数检验-旧对话框-1单样本 K-S
(1)选定待检验的变量到“检验变量列表” 框
(2)检验分布:选择理论分布 ①常规:正态分布 ②相等:均匀分布 ③泊松:泊松分布 ④指数分布:指数分布
(3)决策
①卡方统计量的p值<显著性水平,拒绝原假设,多个 独立样本来自的多个总体的中位数存在显著差异。
②卡方统计量的p值>显著性水平,不拒绝原假设,多 个独立样本来自的总体的中位数不存在显著差异。
7.3.2多独立样本的Kruskal-Wallis检验
1.基本思想 (1)原假设:多个独立样本来自的多个总体的分布无显著差
p
:不拒绝原假设,两总体的分布无显著差异
7.2.4极端反应检验
1.基本思想
(1)原假设:两独立样本来自的两个总体的分布无显著差异。
(2)一组样本为控制样本,一组样本为实验样本,看实验样 本相对于控制样本是否出现了极端反应。
(3)检验步骤
①两组样本混合按升序排列
②求控制样本的最小秩 和最大秩
小样本下,H服从Hollander分布,大样本下,H近似服从正态分布
(4)决策: ①H统计量的p值<显著性水平,拒绝原假设,两独立样本来自的 总体分布存在显著差异 ②H统计量的p值>显著性水平,不拒绝原假设,两独立样本来自 的总体分布不存在显著差异
7.2.5两独立样本非参数检验的步骤
分析-非参数检验-旧对话框-2 独立样本 (1)选择待检验的变量到“检验变量列表”
分析: 产品合格与否属于二值变量,可以通过二 项分布检验实现。
7.1.3单样本K-S检验
1.基本思想 (1)以俄罗斯数学家柯尔莫哥和斯米诺夫名字命名 (2)利用样本数据推断样本来自的总体是否服从某一理论分布,
是一种拟合优度的检验方法,适用于探索连续型随机变量的分布。 (3)步骤 ①计算各样本观测值在理论分布中出现的理论累计概率值F(x) ②计算各样本观测值的实际累计概率值S(x) ③计算理论累计概率值与实际累计概率值的差D(x) ④计算差值序列中最大绝对差值D
1.基本思想-吻合性检验
(1)原假设:样本来自的总体分布与期望分布无显著差异。
变量值落入第i个子集中的理论概率为 pi ,相应的期望频率为
npi
2

k i 1
( fi0
fie)2 fi0
~
2 (k 1)
k 子集个数,
fi0 观察频数,fie 期望频数,
2值越大 观测频数分布与期望频数分布差距越大 2值越小 观测频数分布与期望频数分布差距越小 2对应的p值 ,拒绝原假设,样本来自的总体分布与理论分布存在显著差异 2对应的p值 ,不拒绝原假设,样本来自的总体分布与理论分布无显著差异
7.2.2两独立样本的K-S检验
1.基本思想 (1)原假设:两组独立样本来自的两总体的分布无显著差
异。 (2)与单样本K-S检验的基本思路大体一致,差别在于:以
变量值的秩为分析对象,而非变量值本身。 (3)检验步骤 ①将两组样本混合并按升序排列 ②分别计算两组样本秩的累计频数和累计频率 ③计算两组累计频率的差,得秩的差值序列及D统计量 ④SPSS计算大样本下的 nD和对应的p值 (3)决策:
异。 (2)是两独立样本曼-惠特尼U检验的推广 (3)检验步骤 ①将多组样本数据混合并升序排列,求各变量的秩 ②考察各组秩的均值是否有显著差异
③各组秩的差异借助方差分析:秩的变差分解为:组间差和组 内差 a若秩的总变差大部分可由组间差解释,则各样本组的总体 分布存在显著差异 b若秩的总变差大部分不能由组间差解释,则各样本组的总 体分布无显著差异
相关文档
最新文档