第九章1 非参数检验--单样本

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的个数为m15的个数为n10某村发生一种地方病其住户沿一条河排列调查时对发病的住户标记为cutpoint?输入显著性原理见附件诺夫检验1samplekolmogorovsmirnovtest单样本检验是利用样本数据推断总体是否服从某一理论分布拟合优度检验适用于探索连续型随机变量的分布形态判断定距变量的分布情况
调用此过程可对单样本进行 KolmogorovSmirnov Z检验,它将一个变量的实际频数 分 布 与 正 态 分 布 ( Normal ) 、 均 匀 分 布 (Uniform)、泊松分布(Poisson)进行
比较
Analyze-> Nonparametric Tests->1-Sample K-S
补充:二项分布检验实例
实例:为验证某批产品的一等品率是否达到90%,现从 该批产品中随机抽取23个样品进行检测,结果有19个一 等品(1-一等品,0-非一等品)。(变量2个:一等 品和个数,Cases 2个:1 19 和0 4)
加权:Data->Weight Cases:个数 Analyze-> Nonparametric Tests-> Binomial
如果相伴概率值大于显著性水平,则不能拒绝零假设 H0,认为样本来自的总体分布形态与指定的二项分布 不存在显著差异。
SPSS二项分布检验的数据是实际收集到的样本数据, 而非频数数据。
所以同样需要加权case
实例1:Strain.sav 18个学生先后学用两种方法打同样的结。
紧急情况下选用先学的方法打结的16人, 用后学的方法打结的2人。第一其中相同的0(或相同的1)在一起称为一个游程(单独
的0或1也算)。 这个数据中有4个0组成的游程和3个1组成的游程。一共
是R=7个游程。其中0的个数为m=15,而1的个数为 n=10。
实例1(某村发生一种地方病,其住户沿一条河排列,调查时对发病的 住户标记为“1”,对非发病的住户标记为“0”,共17户:
-.012
.611 .850
b. Calculated fr om data.
Life.sav 人工设定均值为1500. Syntax:
NPAR TESTS /k-s(EXPONENTIAL 1500)=v
单样本Kolmogorov-Smirnov检验
在SPSS软件中对于是否是正态分布或均 匀分布的检验统计量为
第九章 非参数检验
非参数检验的概念
是指在总体不服从正态分布,且分布情况不明 时,用来检验数据资料是否来自同一个总体假 设,等一类检验方法。
这类方法的假定前提比参数性假设检验方法少的多,也容易满足, 适用于计量信息较弱的资料且计算方法也简单易行,所以在实际 中有广泛的应用。
非参数检验的过程
假设,认为心脏病人猝死人数与日期的关系为 2.8:1:1:1:1:1:1 。
二、 二项分布检验 Binomial test
只有两种可能,如果某一类出现的概率是 P , 则 另 一 类 出 现 的 概 率 就 是 1-P 。 这 种 分布称为二项分布。
在现实生活中有很多的取值是两类的,如 人群的男和女、产品的合格和不合格、学 生的三好学生和非三好学生、投掷硬币的 正面和反面。
SPSS中的二项分布检验,在样本小于或等于30时,按照计 算二项分布概率的公式进行计算;样本数大于30时,计 算的是Z统计量,认为在零假设下,Z统计量服从正态分 布。Z统计量的计算公式如下:
SPSS将自动计算Z统计量,并给出相应的相伴概率值。
如果相伴概率小于或等于用户的显著性水平α,则应拒 绝零假设H0,认为样本来自的总体分布形态与指定的 二项分布存在显著差异;
加权:Data->Weight Cases:死亡人数 Analyze-> Nonparametric Tests->Chi Square
Test Variable:死亡日期 Expected Values: 2.8:1:1:1:1:1:1 比较有用的结果:sig=.256>0.05,不能拒绝零
Z
n max i
S( Xi1) F0 ( Xi ) , S( Xi ) F0 ( Xi )
单样本检验方案选择
Χ 2检验、二项检验、K-T检验均为拟合优度检验 Χ 2检验:要求样本容量一般大于50 当只有两类观测结果时,用二项检验 样本数据为连续变量时,最好用K-T检验。K-T检验
实例1的数据可以组织成:两个变量 (side面和number次数),6个 cases。但在卡方检验前要求用number加权。结果同。
---------是对出现频率的统计检验,而不是变量数值,所以变量如果是频 数本身的话,请用此‘频数’加权个案
补充:卡方检验实例
实例:心脏病人猝死人数与日期的关系,收集 168个观测数据。其中用1、2、3、4、5、6、7表 示是星期几死的。而人数分别为55、23、18、11、 26、20、15。推断心脏病人猝死人数与日期的关 系是否为2.8:1:1:1:1:1:1。(变量2个:死亡日期 和死亡人数,Cases 7个)
非参数检验\data\baby.sav
三、 游程检验Runs test
单样本变量随机性检验,是对某变量值的 出现规律是否随机(样本来自随机分布的 总体)进行检验。
游程个数 or 程最大长度 SPSS检验游程个数
关于随机性的游程检验(run test)
游程检验方法是检验一个取两个值的变量,这两个值的出现 是否是随机的。假定下面是由0和1组成的一个这种变量 的样本:
01100010010000110010000101 问病户的分布排列是呈聚集趋势,还是随机分布? ‘cut point’ 输入‘1’:
显著性
原理见附件
四、 一个样本的柯尔莫哥洛夫-斯米 诺夫检验
1-Sample Kolmogorov-Smirnov test
单样本K-S检验是利用样本数据推断总体是否服从某一 理论分布(拟合优度检验),适用于探索连续型随机变 量的分布形态(判断定距变量的分布情况):Normal正 态分布、Uniform均匀分布、Poisson泊松分布、 Exponential指数分布。
一、 卡方检验 Chi-Square test
这里用卡方检验可以检验列联表中某一个变量的各个水平是否 有同样比例或者等于你所想象的比例(如5:4:1)
服从χ 2分布,自由度=k-1
Ho: 样本来自的总体分布形态和期 望分布或某一理论分布没有显著差 异
实例1:掷骰子300次,变量LMT,1、2、3、4、5、6分别代表六面的六个 点,试问这骰子是否均匀。数据data12-01(300个cases)。 Analyze-> Nonparametric Tests->Chi Square Test Variable: lmt 想要检验的变量 由于这是一个均匀分布检测,使用默认选择(Expected Values:All categories equal作为零假设); 比较有用的结果:sig=.111>0.05,不能拒绝零假设,认为均匀。
是功效最强的拟合优度检验 离散变量、频数足够大时最好用Χ 2检验。
1. Chi-Square test 卡方检验 2. Binomial test 二项分布检验 3. Runs test 游程检验 4. 1-Sample Kolmogorov-Smirnov test 一个样本柯尔
莫哥洛夫-斯米诺夫检验 5. 2 independent Samples Test 两个独立样本检验 6. K independent Samples Test K个独立样本检验 7. 2 related Samples Test 两个相关样本检验 8 . K related Samples Test 两个相关样本检验
Test Variable:一等品 Test Proportion:0.9 比较有用的结果:两组个数和sig=.193>0.05,不能拒绝零假设,
认为该批产品的一等品率达到了90% 。
某地某一时期内出生35名婴儿,其中女性19名 (定Sex=0),男性16名(定Sex=1)。问这 个地方出生婴儿的性别比例与通常的男女性比 例(总体概率约为0.5)是否不同?
Most Extreme Differences
Mean A bsolute Positiv e Negative
Kolmogorov -Smirnov Z A sy mp. Sig. (2-tailed)
a. Test distribution is Poisson.
ZD 2608
3.8673 .012 .010
Test Variable: zd
Test Distribution: Poisson
One-Sample Kolmogor ov-Smir nov Test
结果:
均值(3.8673)、 sig=.850>0.5, 不能拒绝零假设,
认为服从泊松分布。
N Poisson Parametera,b
相关文档
最新文档