非参数检验的概念与过程
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Test Variable:一等品 Test Proportion:0.9 比较有用的结果:两组个数和sig=.193>0.5,不能拒绝零假
设,认为该批产品的一等品率达到了90% 。
12.3 游程检验Runs test
单样本变量随机性检验是对某变量值出现是否随机进行
检验。
实例1(同二项分布检验) :掷一枚比赛用的挑边器
非参数检验
说明:非参数检验这章,请看下面吴 喜之教授的讲义,更为具体的可参看 《统计分析与SPSS的应用》薛薇 编著 人大出版社,2002.7第二次印刷
非参数检验的概念
是指在总体不服从正态分布且分布情况 不明时,用来检验数据资料是否来自同 一个总体假设的一类检验方法。由于这 些方法一般不涉及总体参数故得名。 这类方法的假定前提比参数性假设检验 方法少的多,也容易满足,适用于计量 信息较弱的资料且计算方法也简单易行, 所以在实际中有广泛的应用。
单样本K-S检验是利用样本数据推断总体是否服从某一理论分布,
适用于探索连续型随机变量的分布形态(判断定距变量的分布情
况):Normal正态分布、Uniform均匀分布、Poisson泊松分布、
Exponential指数分布。
实例 :卢瑟福和盖革作了一个著名的实验,他们观察了长为7.5秒
12.1 卡方检验 Chi-SqBaidu Nhomakorabeaare test
这里介绍的卡方检验可以检验列联表中某一个变量的各 个水平是否有同样比例或者等于你所想象的比例(如 5:4:1) 实例1:掷骰子300次,变量LMT,1、2、3、4、5、 6分别代表六面的六个点,试问这骰子是否均匀。数据 data12-01(300个cases)。
补充:二项分布检验实例
实例:为验证某批产品的一等品率是否达到90%,现 从该批产品中随机抽取23个样品进行检测,结果有19 个一等品(1-一等品,0-非一等品)。(变量2个: 一等品和个数,Cases 2个:1 19 和0 4) 加权:Data->Weight Cases:个数 Analyze-> Nonparametric Tests-> Binomial
认为挑边器出现AB面是随机的。
Runs Test
Test Valuea Total Cases Number of Runs Z Asymp. Sig. (2-tailed)
a. User-specified.
TBH 2
31 21 1.469 .142
12.4 一个样本柯尔莫哥洛夫-斯米诺夫检验 1-Sample Kolmogorov-Smirnov test
Test Variable:死亡日期 Expected Values: 2.8:1:1:1:1:1:1 比较有用的结果:sig=.256>0.5,不能拒绝零假设,认为心
脏病人猝死人数与日期的关系为2.8:1:1:1:1:1:1 。
12.2 二项分布检验 Binomial test
二项分布:在现实生活中有很多的取值是两类的,如人 群的男和女、产品的合格和不合格、学生的三好学生和 非三好学生、投掷硬币的正面和反面。这时如果某一类 出现的概率是P,则另一类出现的概率就是1-P。这种 分布称为二项分布。 实例1:掷一枚比赛用的挑边器31次,变量tbh,1为 出现A面、2为出现A面,试问这挑边器是否均匀。数据 data12-03(31个cases)。
非参数检验的过程
1. Chi-Square test 卡方检验 2. Binomial test 二项分布检验 3. Runs test 游程检验 4. 1-Sample Kolmogorov-Smirnov test 一个样本 柯尔莫哥洛夫-斯米诺夫检验 5. 2 independent Samples Test 两个独立样本检验 6. K independent Samples Test K个独立样本检验 7. 2 related Samples Test 两个相关样本检验 8 . K related Samples Test 两个相关样本检验
Analyze-> Nonparametric Tests-> Binomial Test Variable: tbh 由于这是一个均匀分布检测,使用默认选择(Test
Proportion:0.5); 比较有用的结果:两组个数和sig=1.00>0.5,不能拒绝零假
设,认为挑边器是均匀。
实例1的数据可以组织成:两个变量(side面和 number次数),2个cases。但在二项分布检验前要 求用number加权。结果同。
31次,变量tbh,1为出现A面、2为出现A面,试问这
挑边器出现AB面是否随机。数据data12-03(31个
cases)。
Analyze-> Nonparametric Tests-> Runs
Test Variable: tbh Cut Point:Custom:2 比较有用的结果:
总case数(31)、 游程Run数(21)、 sig=.142>0.5, 不能拒绝零假设,
匀。
实例1的数据可以组织成:两个变量(side面和 number次数),6个cases。但在卡方检验前要求用 number加权。结果同。
补充:卡方检验实例
实例:心脏病人猝死人数与日期的关系,收集168个观 测数据。其中用1、2、3、4、5、6、7表示是星期几 死的。而人数分别为55、23、18、11、26、20、15。 推断心脏病人猝死人数与日期的关系是否为 2.8:1:1:1:1:1:1。(变量2个:死亡日期和死亡人数, Cases 7个) 加权:Data->Weight Cases:死亡人数 Analyze-> Nonparametric Tests->Chi Square
Analyze-> Nonparametric Tests->Chi Square Test Variable: lmt 想要检验的变量 由于这是一个均匀分布检测,使用默认选择(Expected
Values:All categories equal作为零假设); 比较有用的结果:sig=.111>0.5,不能拒绝零假设,认为均
设,认为该批产品的一等品率达到了90% 。
12.3 游程检验Runs test
单样本变量随机性检验是对某变量值出现是否随机进行
检验。
实例1(同二项分布检验) :掷一枚比赛用的挑边器
非参数检验
说明:非参数检验这章,请看下面吴 喜之教授的讲义,更为具体的可参看 《统计分析与SPSS的应用》薛薇 编著 人大出版社,2002.7第二次印刷
非参数检验的概念
是指在总体不服从正态分布且分布情况 不明时,用来检验数据资料是否来自同 一个总体假设的一类检验方法。由于这 些方法一般不涉及总体参数故得名。 这类方法的假定前提比参数性假设检验 方法少的多,也容易满足,适用于计量 信息较弱的资料且计算方法也简单易行, 所以在实际中有广泛的应用。
单样本K-S检验是利用样本数据推断总体是否服从某一理论分布,
适用于探索连续型随机变量的分布形态(判断定距变量的分布情
况):Normal正态分布、Uniform均匀分布、Poisson泊松分布、
Exponential指数分布。
实例 :卢瑟福和盖革作了一个著名的实验,他们观察了长为7.5秒
12.1 卡方检验 Chi-SqBaidu Nhomakorabeaare test
这里介绍的卡方检验可以检验列联表中某一个变量的各 个水平是否有同样比例或者等于你所想象的比例(如 5:4:1) 实例1:掷骰子300次,变量LMT,1、2、3、4、5、 6分别代表六面的六个点,试问这骰子是否均匀。数据 data12-01(300个cases)。
补充:二项分布检验实例
实例:为验证某批产品的一等品率是否达到90%,现 从该批产品中随机抽取23个样品进行检测,结果有19 个一等品(1-一等品,0-非一等品)。(变量2个: 一等品和个数,Cases 2个:1 19 和0 4) 加权:Data->Weight Cases:个数 Analyze-> Nonparametric Tests-> Binomial
认为挑边器出现AB面是随机的。
Runs Test
Test Valuea Total Cases Number of Runs Z Asymp. Sig. (2-tailed)
a. User-specified.
TBH 2
31 21 1.469 .142
12.4 一个样本柯尔莫哥洛夫-斯米诺夫检验 1-Sample Kolmogorov-Smirnov test
Test Variable:死亡日期 Expected Values: 2.8:1:1:1:1:1:1 比较有用的结果:sig=.256>0.5,不能拒绝零假设,认为心
脏病人猝死人数与日期的关系为2.8:1:1:1:1:1:1 。
12.2 二项分布检验 Binomial test
二项分布:在现实生活中有很多的取值是两类的,如人 群的男和女、产品的合格和不合格、学生的三好学生和 非三好学生、投掷硬币的正面和反面。这时如果某一类 出现的概率是P,则另一类出现的概率就是1-P。这种 分布称为二项分布。 实例1:掷一枚比赛用的挑边器31次,变量tbh,1为 出现A面、2为出现A面,试问这挑边器是否均匀。数据 data12-03(31个cases)。
非参数检验的过程
1. Chi-Square test 卡方检验 2. Binomial test 二项分布检验 3. Runs test 游程检验 4. 1-Sample Kolmogorov-Smirnov test 一个样本 柯尔莫哥洛夫-斯米诺夫检验 5. 2 independent Samples Test 两个独立样本检验 6. K independent Samples Test K个独立样本检验 7. 2 related Samples Test 两个相关样本检验 8 . K related Samples Test 两个相关样本检验
Analyze-> Nonparametric Tests-> Binomial Test Variable: tbh 由于这是一个均匀分布检测,使用默认选择(Test
Proportion:0.5); 比较有用的结果:两组个数和sig=1.00>0.5,不能拒绝零假
设,认为挑边器是均匀。
实例1的数据可以组织成:两个变量(side面和 number次数),2个cases。但在二项分布检验前要 求用number加权。结果同。
31次,变量tbh,1为出现A面、2为出现A面,试问这
挑边器出现AB面是否随机。数据data12-03(31个
cases)。
Analyze-> Nonparametric Tests-> Runs
Test Variable: tbh Cut Point:Custom:2 比较有用的结果:
总case数(31)、 游程Run数(21)、 sig=.142>0.5, 不能拒绝零假设,
匀。
实例1的数据可以组织成:两个变量(side面和 number次数),6个cases。但在卡方检验前要求用 number加权。结果同。
补充:卡方检验实例
实例:心脏病人猝死人数与日期的关系,收集168个观 测数据。其中用1、2、3、4、5、6、7表示是星期几 死的。而人数分别为55、23、18、11、26、20、15。 推断心脏病人猝死人数与日期的关系是否为 2.8:1:1:1:1:1:1。(变量2个:死亡日期和死亡人数, Cases 7个) 加权:Data->Weight Cases:死亡人数 Analyze-> Nonparametric Tests->Chi Square
Analyze-> Nonparametric Tests->Chi Square Test Variable: lmt 想要检验的变量 由于这是一个均匀分布检测,使用默认选择(Expected
Values:All categories equal作为零假设); 比较有用的结果:sig=.111>0.5,不能拒绝零假设,认为均