第七章spss非参数检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 1.基本思想-吻合性检验
(1)原假设:样本来自的总体分布与期望分布无显著差异。
变量值落入第i个子集中的理论概率为 pi ,相应的期望频率为npi
2
k i 1
( fi0
fwenku.baidu.come)2 fi0
~
2 (k 1)
k 子集个数,
fi0 观察频数,fie 期望频数,
2值越大 观测频数分布与期望频数分布差距越大 2值越小 观测频数分布与期望频数分布差距越小 2对应的p值 ,拒绝原假设,样本来自的总体分布与理论分布存在显著差异 2对应的p值 ,不拒绝原假设,样本来自的总体分布与理论分布无显著差异
3.应用案例
• 利用“产品合格率”数据,推断该批产品的一级品 率是否为90%
• 分析:
产品合格与否属于二值变量,可以通过二项分布检 验实现。
7.1.3单样本K-S检验
• 1.基本思想
(1)以俄罗斯数学家柯尔莫哥和斯米诺夫名字命名 (2)利用样本数据推断样本来自的总体是否服从某一理论分布,
是一种拟合优度的检验方法,适用于探索连续型随机变量的分布 (3)步骤 ①计算各样本观测值在理论分布中出现的理论累计概率值F(x) ②计算各样本观测值的实际累计概率值S(x) ③计算理论累计概率值与实际累计概率值的差D(x) ④计算差值序列中最大绝对差值D
第七章
SPSS非参数检验
本章内容
• 7.1 单样本的非参数检验 • 7.2 两独立样本的非参数检验 • 7.3 多独立样本的非参数检验 • 7.4 两配对样本的非参数检验 • 7.5 多配对样本的非参数检验
非参数检验
• 非参数检验:
(1)在总体分布未知或知道甚少的情况下,利用 样本数据对总体分布形态等进行推断的方法。 (2)推断过程中不涉及有关总体分布的参数。
分析。
(3)[Expected values]给出各理论值 [All categories equal]:所有子集的频数都相同 [value]:依次输入值,通过[add]、[change]、[remove]
进行增加、修改和删除。
3.应用案例
• 医学研究表明心脏病人猝死人数与日期的关系为:
一周内,星期一猝死者较多,其他日子基本相当, 各天的比例近似为:2.8:1:1:1:1:1:1 根据“心脏病猝死”数据,推断总体分布是否与理 论分布相吻合。 分析: 利用总体分布卡方检验实现。
3.应用案例
• 利用“儿童身高”数据分析周岁儿童身高总体是否 服从正态分布。
• 分析:
可以通过单样本K-S检验实现。
7.1.4 变量值随机性检验
• 1.基本思想
(1)通过对样本变量值的分析,实现对总体的变量值出 现是否随机进行检验。
(2)原假设:总体变量值出现是随机的。 ①检验依据:游程-样本序列中连续出现相同的变量值 的次数。 ②游程数太大或太小都表明变量值存在不随机的现象
(3)检验统计量
Z r r r:游程数 r
r
2n1n2 n1 n2
2 r
2n1n2 (2n1n2 n1 n2 ) (n1 n2 )2 (n1 n2 1)
(4)决策:
n1 出现1的个数,n2 出现0的个数
Z统计量的p值<显著性水平,拒绝原假设,变量值的出现不是随机的。
Z统计量的p值>显著性水平,不拒绝原假设,变量值的出现是随机的。
(1)选定待检验的变量到[Test Variable list] (2)[define dichotomy]中指定如何分类 [get from data]:检验变量为二值变量 [cut point]:输入具体数值,大于等于该值的为第
一组,大于该组的为第二组
(3)[Test proportion]:输入二项分布的检验 概率值
• 2.实现步骤
[Analyze]-[Nonparametric Tests]-[ChiSquare]
(1)选定待检验的变量到[Test Variable list] (2)在[Expected Range]中确定参与分析的观测值的范围: [Get from data]:所有观测数据都参与分析 [use specified range]:只在该取值范围内的观测数据才参与
7.1.2二项分布检验
• 1.基本思想
(1)通过样本数据检验样本来自的总体是否服从指定概率p 的二项分布。
(2)小样本-精确检验
x
P{X x} Cni piqni i0
大样本-近似检验
Z x 0.5 np np(1 p)
x 2 时加0.5 x 2 时减0.5
n
n
2.实现步骤
[Analyze]-[Nonparametric Tests]-[Binomial]
D max( S(xi ) F(xi ) 由于实际累计概率为离散值,可对D修正为: 修正D : D max(max(S(xi ) F (xi ) , max( S(xi1) F(xi ) )
(4)原假设成立时: ①小样本下:D~kolmogorov分布
②大样本下: nD 近似服从K(x)分布 ③SPSS仅给出大样本下的nD 和对应的p值 (5)决策 ①D统计量的p值<显著性水平,拒绝原假设,样本来自
的总体与指定分布有显著差异
②D统计量的p值>显著性水平,不拒绝原假设,样本来 自的总体与指定分布无显著差异
2.实现步骤
[Analyze]-[Nonparametric Tests]-[1-sample K-S]
(1)选定待检验的变量到[Test Variable list] (2)[Test distribution]:选择理论分布 ①[normal]:正态分布 ②[uniform]:均匀分布 ③[poisson]:泊松分布 ④[exponential]:指数分布
2.实现步骤
[Analyze]-[Nonparametric Tests]-[Runs]
7.1 单样本的非参数检验
1.目的:样本来自总体的分布是否与某个已知的分布 相吻合?
—绘制样本数据的直方图、pp图、QQ图判断—粗略 —通过非参数检验—精确 2.单样本非参数检验 (1)对单个总体的分布形态等进行推断 (2)方法:卡方检验、二项分布检验、K-S检验、
变量值随机性检验等。
7.1.1总体分布的卡方检验
(1)原假设:样本来自的总体分布与期望分布无显著差异。
变量值落入第i个子集中的理论概率为 pi ,相应的期望频率为npi
2
k i 1
( fi0
fwenku.baidu.come)2 fi0
~
2 (k 1)
k 子集个数,
fi0 观察频数,fie 期望频数,
2值越大 观测频数分布与期望频数分布差距越大 2值越小 观测频数分布与期望频数分布差距越小 2对应的p值 ,拒绝原假设,样本来自的总体分布与理论分布存在显著差异 2对应的p值 ,不拒绝原假设,样本来自的总体分布与理论分布无显著差异
3.应用案例
• 利用“产品合格率”数据,推断该批产品的一级品 率是否为90%
• 分析:
产品合格与否属于二值变量,可以通过二项分布检 验实现。
7.1.3单样本K-S检验
• 1.基本思想
(1)以俄罗斯数学家柯尔莫哥和斯米诺夫名字命名 (2)利用样本数据推断样本来自的总体是否服从某一理论分布,
是一种拟合优度的检验方法,适用于探索连续型随机变量的分布 (3)步骤 ①计算各样本观测值在理论分布中出现的理论累计概率值F(x) ②计算各样本观测值的实际累计概率值S(x) ③计算理论累计概率值与实际累计概率值的差D(x) ④计算差值序列中最大绝对差值D
第七章
SPSS非参数检验
本章内容
• 7.1 单样本的非参数检验 • 7.2 两独立样本的非参数检验 • 7.3 多独立样本的非参数检验 • 7.4 两配对样本的非参数检验 • 7.5 多配对样本的非参数检验
非参数检验
• 非参数检验:
(1)在总体分布未知或知道甚少的情况下,利用 样本数据对总体分布形态等进行推断的方法。 (2)推断过程中不涉及有关总体分布的参数。
分析。
(3)[Expected values]给出各理论值 [All categories equal]:所有子集的频数都相同 [value]:依次输入值,通过[add]、[change]、[remove]
进行增加、修改和删除。
3.应用案例
• 医学研究表明心脏病人猝死人数与日期的关系为:
一周内,星期一猝死者较多,其他日子基本相当, 各天的比例近似为:2.8:1:1:1:1:1:1 根据“心脏病猝死”数据,推断总体分布是否与理 论分布相吻合。 分析: 利用总体分布卡方检验实现。
3.应用案例
• 利用“儿童身高”数据分析周岁儿童身高总体是否 服从正态分布。
• 分析:
可以通过单样本K-S检验实现。
7.1.4 变量值随机性检验
• 1.基本思想
(1)通过对样本变量值的分析,实现对总体的变量值出 现是否随机进行检验。
(2)原假设:总体变量值出现是随机的。 ①检验依据:游程-样本序列中连续出现相同的变量值 的次数。 ②游程数太大或太小都表明变量值存在不随机的现象
(3)检验统计量
Z r r r:游程数 r
r
2n1n2 n1 n2
2 r
2n1n2 (2n1n2 n1 n2 ) (n1 n2 )2 (n1 n2 1)
(4)决策:
n1 出现1的个数,n2 出现0的个数
Z统计量的p值<显著性水平,拒绝原假设,变量值的出现不是随机的。
Z统计量的p值>显著性水平,不拒绝原假设,变量值的出现是随机的。
(1)选定待检验的变量到[Test Variable list] (2)[define dichotomy]中指定如何分类 [get from data]:检验变量为二值变量 [cut point]:输入具体数值,大于等于该值的为第
一组,大于该组的为第二组
(3)[Test proportion]:输入二项分布的检验 概率值
• 2.实现步骤
[Analyze]-[Nonparametric Tests]-[ChiSquare]
(1)选定待检验的变量到[Test Variable list] (2)在[Expected Range]中确定参与分析的观测值的范围: [Get from data]:所有观测数据都参与分析 [use specified range]:只在该取值范围内的观测数据才参与
7.1.2二项分布检验
• 1.基本思想
(1)通过样本数据检验样本来自的总体是否服从指定概率p 的二项分布。
(2)小样本-精确检验
x
P{X x} Cni piqni i0
大样本-近似检验
Z x 0.5 np np(1 p)
x 2 时加0.5 x 2 时减0.5
n
n
2.实现步骤
[Analyze]-[Nonparametric Tests]-[Binomial]
D max( S(xi ) F(xi ) 由于实际累计概率为离散值,可对D修正为: 修正D : D max(max(S(xi ) F (xi ) , max( S(xi1) F(xi ) )
(4)原假设成立时: ①小样本下:D~kolmogorov分布
②大样本下: nD 近似服从K(x)分布 ③SPSS仅给出大样本下的nD 和对应的p值 (5)决策 ①D统计量的p值<显著性水平,拒绝原假设,样本来自
的总体与指定分布有显著差异
②D统计量的p值>显著性水平,不拒绝原假设,样本来 自的总体与指定分布无显著差异
2.实现步骤
[Analyze]-[Nonparametric Tests]-[1-sample K-S]
(1)选定待检验的变量到[Test Variable list] (2)[Test distribution]:选择理论分布 ①[normal]:正态分布 ②[uniform]:均匀分布 ③[poisson]:泊松分布 ④[exponential]:指数分布
2.实现步骤
[Analyze]-[Nonparametric Tests]-[Runs]
7.1 单样本的非参数检验
1.目的:样本来自总体的分布是否与某个已知的分布 相吻合?
—绘制样本数据的直方图、pp图、QQ图判断—粗略 —通过非参数检验—精确 2.单样本非参数检验 (1)对单个总体的分布形态等进行推断 (2)方法:卡方检验、二项分布检验、K-S检验、
变量值随机性检验等。
7.1.1总体分布的卡方检验