§5 非参数检验(纲要)
非参检验PPT课件
![非参检验PPT课件](https://img.taocdn.com/s3/m/0408dd5f0b1c59eef8c7b464.png)
Npar
两均值比较相 独关 立样 样本 本中符 符秩数号 号和检等检检验级验验法检法法(((验MSMieg法adnn(i)Wnani)lWcohxiotnne)y U ) 多均值比较随完机全区随组机::弗克里 瓦德氏曼方方差差分分析析((KFrruiesdkmalaann)d Wallis H )
非参数检验
1
非参数检验是与参数检验相对应的,参数 检验指的是在总体分布已知,满足某些 假定条件(独立性、方差齐性等),检验的 数据一般为连续数据的情况下进行的检 验。如果有些条件不能满足, 则采用非参 数检验,可以根据实际情况采用如下一 些方法进行检验, 这些检验都是在 Nonparametric tests菜单项里执行。
9
练习
• 输入以下数据并检验两组数据的差异性:
– 甲:12,14,15,12,21,31,26,21 – 乙:21,32,15,21,12,14,12,15
• 1.假设上述配对样本资料 • 2.假设上述资料不是配对样本资料
10
2020/1/1
11
3
两独立样本非参数检验例题
设有两种安眠药,考虑它们的治疗效果(失眠者服用之 后睡眠延长的小时数),现将20名患者分成两组,分别服用 一种药,收集的数据如下:
甲 1.9 0.8 1.1 0.1 0.1 4.4 5.5 1.6 4.6 3.4 乙 0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0 由于延长的时数的分布不明,我们考虑用非参数检验 ! Mann-Whitney U 类似于t检验。
由于脉博跳动的次数不服从正态分布,我们考虑用非 参数检验。
5
2020/1/1
6
多个独立样本非参数检验例1
第5讲 非参数检验.ppt
![第5讲 非参数检验.ppt](https://img.taocdn.com/s3/m/6963511faeaad1f347933fa4.png)
非参数统计检验是一种这样的检验,其模型对于被抽样总体的 参数不规定条件,即非参数检验是不依棘总体分布的统计检验 方法,是指在总体不服从正态分布且分布情况不明时,用来检 验数据资料是否来自同一个总体假设的一类检验方法。
一、单样本非参数检验
单样本非参数统计检验方法可以检验只需抽取一个样本的假设。 该检验是检验某特定样本是否来自于某指定的总体。
Close
配对资料的符号秩和检验 (Wilcoxon配对法)
Close
例6-1 某医院对12例患者进行“巩 膜瓣下灼烙角膜咬切术”,手术前后的 视力如表6-1,问手术后视力是否有改 善?
Close
病人编号 (1) 1 2 3 4 5 6 7 8 9 10 1 4.1 4.5 4.7 4.0 4.1 5.2 4.1 4.1 4.8
Close
Close
本例是检验均匀分布的。 Close
Close
H 0: 20 2 22 /2(n 1 )或 21 /2 2(n 1 ) 也 就 是 P (22 /2(n 1 )) =/ 2 P (2 C lo1 s e/2 2(n 1 ))= /2
二、二项检验 对于任意的两类总体,如果已知其中一类事件所占的比例为P, 那么另一类所占的比例为1-P,
Close
Close
Close
Close
Close
Close
假设检验——非参数检验
![假设检验——非参数检验](https://img.taocdn.com/s3/m/b323ff10d5bbfd0a785673bd.png)
假设检验(二)——非参数检验假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。
上一节我们所介绍的Z 检验、t 检验,都是参数检验。
它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。
参数检验就是要通过样本统计量去推断或估计总体参数。
然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。
这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。
非参数检验是通过检验总体分布情况来实现对总体参数的推断。
非参数检验法与参数检验法相比,特点可以归纳如下:(1)非参数检验一般不需要严格的前提假设;(2)非参数检验特别适用于顺序资料;(3)非参数检验很适用于小样本,并且计算简单;(4)非参数检验法最大的不足是没能充分利用数据资料的全部信息;(5 )非参数检验法目前还不能用于处理因素间的交互作用。
非参数检验的方法很多,分别适用于各种特点的资料。
本节将介绍几种常用的非参数检验方法。
一.2检验2检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。
22检验的方法主要包括适合性检验和独立性检验。
(一)2检验概述2是实得数据与理论数据偏离程度的指标。
其基本公式为:2 ( f0 f e)(公式11—9)fe式中,f0 为实际观察次数,f e 为理论次数。
分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2。
观察公式可发现,如果实际观察次数与理论次数的差异越小, 2值也就越小。
当 f 0 与 f e 完全相同时,2值为零。
际次数与理论次数之差的大小而变化利用2值去检验实际观察次数与理论次数的差异是否显著的方法称为2检验有两个主要的作第一,可以用来检验各种实际次数与理论次数是否吻合的这类问题统称为适合性检验; 第二, 判断计数的两组或多组资料是否相互关联还是相互独立的问 题,这类问题统称为独立性检验。
第五讲 非参数检验
![第五讲 非参数检验](https://img.taocdn.com/s3/m/14461f254b73f242336c5f4d.png)
采用非参数检验方法进行检验,判断四个城 市周岁儿童的身高分布是否存在显著差异
多独立样本的非参数检验
操作演示
多独立样本的非参数检验
多独立样本的非参数检验
Kruskal-Wallis检验
多独立样本的非参数检验
Kruskal-Wallis检验结果 概率P值(0.003)小于显 著性水平α(0.05),因此 应该拒绝原假设,可以认为 四个城市周岁儿童的身高分 布存在显著差异
卡方检验
卡方检验方法可以根据样本数据,推断总 体分布与期望分布或某一理论分布是否存 在显著差异
卡方检验
卡方检验基本思想的理论依据
如果从一个随机变量X中随机抽取若干个观 察样本,这些观察样本落在X的k个互不相干 的子集中的观察频数服从一个多项分布,该 多项分布当k趋于无穷时近似服从卡方分布
卡方检验 二项分布检验 单样本K-S检验
掌握和熟悉两独立样本K-S检验的操作步骤 掌握和熟悉多独立样本Kruskal-Wallis检验的 操作步骤
课堂练习2
利用第2章第6题的数据(居民储蓄调查数 据.sav),分析存款金额的总体分布与正 态分布是否存在显著差异
课堂练习3
某店铺老板认为一周七天中光临店铺的顾客数 量相同,现随机收集某一周七天的顾客数量如 下,请检验一周内各日的顾客人数是否相同
课堂练习1——关键点
一 11
二 19
三 17
检验结果
概率P值(0.344)大于显著性水平α(0.05),因 此不能拒绝原假设,可以认为周岁儿童的总体分布 与正态分布无显著差异
Normal:正态分布 Uniform:均匀分布 Poisson:泊松分布 Exponential: 指数分布
非参数验课件
![非参数验课件](https://img.taocdn.com/s3/m/79dd6f3e804d2b160a4ec052.png)
秩次和秩和
“秩”即按数据大小排定的次序号,又称秩次号。编秩 就是将观察值按顺序由小到大排列,并用序号代替原始 变量值本身。用秩次号代替原始数据后,所得某些秩次 号之和,即按某种顺序排列的序号之和,称为秩和。设 有以下两组数据:
A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7
•编秩后,按差值的正负给秩次冠上符号。
分析步骤:
(3)求差值为正或负的秩和 差值为正的秩和以T+表示 差值为负的秩和以T-表示。 T++T-=n(n+1)/2 T=min(T+,T-)
(4)确定P值和作出推断结论:
当n≤50时,查T界值表
T在界值范围内
P>α
T在界值范围外或相等 P<α
例1 临床某医生研究白癜风病人的白介素IL6水平(u/l)在白斑部位与正常部位有无差异 ,调查的资料如表1所示:
表2 尿氟含量X(1)
2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 2.99 3.19 3.37 4.57
12名工人尿氟含量测定的结果 差值d=X-2.15 (2) 0 -0.05 0.05 -0.03 0.27 0.37 0.47 0.57 0.84 1.04 1.22 2.42
对总体的分布类型 不作任何要求
不受总体参数的影响, 比较分布或分布位置 适用范围广;可用于任 何类型资料(等级资料, 或“>50mg” )
参数检验与非参数检验比较
参数检验 要求资料服从 某种分布
检验效率高
非参检验
1. 对资料的分布没有特殊要求,总体为 偏态、总体分布未知的计量资料(尤 其在n<30的情况)
非参数检验 PPT
![非参数检验 PPT](https://img.taocdn.com/s3/m/379cd6fa4128915f804d2b160b4e767f5acf808e.png)
分类
参数检验(parametric tests) - 对总体参数(平均数、成数、方差等) 所作得假设进行检验
非参数检验(自由分布检验) -对总体分布形式得假设进行检验
问题得提出
我们想去检验得论述如下: 1、经过西弗吉尼亚公路150号里程碑得汽车平均时速为68 英里/小时。 2、租用雪佛龙Trail Blazer (一款中型SUV车)三年,平均行驶里 程为32000英里。 3、美国家庭居住在一座独幢住宅得平均时间为11、8年。 4、2005年四年制大学毕业生得平均起薪为37 130美元/年。 5、中西部偏北地区35%得退休人员会在退休后得1年内卖掉 她们得住房,搬到气候温暖得地方居住。 6、80%得经常购买州彩票得彩民,从未在一次下注中赢得超 过100美元得奖金。
原假设
如果公司所在市平均受教育年限为:13
问:就是否有所不同 就是否高于
数据集3
如果公司所在市平均薪水为:35000
问:就是否有所不同 就是否低于
大家学习辛苦了,还是要坚持
继续保持安静
设计检验统计量
所设计得检验统计量与原假设相关, 即 与待检验得参数相关。 我们需要知道当原假设为真时该统计量 得具体分布。
问:就是否有显著不同?
区间估计 x t (n 1) s 499.5 2.797 2.63/ 25 498.03 ~ 500.97
2
n
问:就是否能断定饮料厂商欺骗了消费者?
区间估计
x t (n 1)
s 499.5 2.492 2.63/ n
25 500.81
(,500.81)
假设检验五步法
n1 n2
z X1 X2 s12 s22 n1 n2
t
非参数检验(提纲)
![非参数检验(提纲)](https://img.taocdn.com/s3/m/3be4f388cc22bcd126ff0c10.png)
非参数检验参数检验方法,尤其是对计量资料,需要对研究的总体作一些比较严格的假定。
例如t检验法要求总体分布是正态分布等。
在实际工作中的许多资料不符合这种要求,因此以上的参数检验方法的使用受到了限制。
近代统计学家发明了对总体分布不必作限制性假定的检验技术,这种技术称为非参数检验(Nonparametric tests)。
非参数检验法是指在总体不服从正态分布或分布情况不明时,用来检验数据资料是否来自相同总体假设的一类检验方法。
由于它的假定前堤比参数检验方法少的多,而且在收集资料方面也十分简单,例如可以用“等级”或“符号”来评定观察的结果等,故这类方法在实际中有着广泛的应用。
第一节两相关样本的显著性检验1.1 符号检验法在配对实验中,将每对(或同一)实验单位(或先后)给予两种不同的处理,比较两种处理的效果有无差异或比较一组实验单位处理先后有无不同。
凡配对计量资料不服从正态分布要求时,可选用符号检验法(Sign test)。
例题1 有x,y 12对数据,它们的数值及相差符号由表1给出。
表1 本例的数据资料序号 1 2 3 4 5 6 7 8 9 10 11 12X 3 1 6 3 2 1 4 7 3 8 4 5Y 2 4 4 7 2 2 2 5 3 6 2 2 问这两个序列数值的差异是否具有显著性(α=0.05)?1.2 符号秩和检验法符号检验中只考虑配对数据x i-y i的符号,计算十分简便,但因没有考虑到x i-y i 差值的大小,因此对资料的利用不够充分,检验的灵敏度也不够好。
符号秩和检验法是上述方法的改进,由于关注到了差值的大小,故效果较好。
凡配对计量或计数的资料,可选用符号秩和检验法(Wilcoxon法)。
例题2 为研究长跑运动对增强普通高校学生的心功能效果,对某学院15名男生进行实验,经过5个月的长跑锻炼后观察其晨脉变化情况。
锻炼前后的晨脉数据如下。
问锻炼前后晨脉间的差异有无显著性(α=0.05)?表2 长跑锻炼前后的晨脉数、差值及其秩次序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 前70 76 56 63 63 56 58 60 65 65 75 66 56 59 70 后46 54 60 64 48 55 54 45 51 48 56 48 64 50 54 差值22 22 -4 -1 15 1 4 15 14 17 19 18 -8 9 16 秩次14.5 14.5 –3.5 –1.5 8.5 1.5 3.5 8.5 7 11 13 12 -5 6 101.3 用spss对两相关样本进行非参数检验spss软件包的Nonparametric Tests过程为两相关样本通常提供了3种非参数检验方法,它们是:Sign 检验,用于对两相关样本的总体做符号检验。
第五章 非参数检验
![第五章 非参数检验](https://img.taocdn.com/s3/m/2adc47c40c22590102029de1.png)
6.4 Kendall协同系数检验
① DPS 立即得到结果:
协同系数W=0.4911,近似卡方值为27.5000, p=0.0166<0.05,表明不同机构对学校的排序是 正相关的,是有显著一致性的。
6.5 二元响应的Cochran检验
第1组(A组)为对照组,多重比较显示,第1组与第2 组差异显著(p=0.0102<0.05),第1组与第2组差异显著 (p=0.0172<0.05)
6.3 多个样本比较的秩和检验
6.3.2 中位数检验
当2个或2个以上的资料不服从正态分布时, 我们可以使用这一方法进行检验。当资料服从正
态分布时,用中位数检验方法进行检验其效率总
第五章 非参数检验
非参数检验对总体分布的具体形式不作任 何限制性的假定,不宜总体参数具体数值 估计或检验为目的。非参数检验最大的特 点是对样本资料无特殊要求,但检验的效 率要低于参数检验。如对非配对资料的秩 和检验,其效率仅为t检验的86.4%,也就 是说,以相同概率判断出显著差异,t检验 所需样本含量要比秩和检验少13.6%。
p=0.0210<0.05,表明给药前后灌流滴数有显著 差异。
6.2.2 非配对样本符号秩检验
非间秩次的比较,它比配对样 本的秩次检验的应用更为普遍。 常用的有两样本的Wilcoxon秩和 检验以及在此基础上发展的MannWhitney检验。
6.3 多个样本比较的秩和检验
6.3.1 Kruskal-Wallis 检验
① DPS 输入数据,选择数据,点击菜单试验统计→非 参数检验→Kruskal Wallis检验:
非参数检验
![非参数检验](https://img.taocdn.com/s3/m/a5f6aed0e2bd960591c6771d.png)
➢ 编秩:数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重(kg)xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验 (Friedman test)
正态近似法
如果n1或n2-n1超出附表的范围,可按下式 计算u值:
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时,应用下式进行校正:
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料(或等级资料)两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分 差 值
非参数检验ppt课件
![非参数检验ppt课件](https://img.taocdn.com/s3/m/1aa9c0fa58fafab068dc024e.png)
优点: ①适用范围广,不受总体分布的限制; ②对数据的要求不严,如某些指标难以准确测定,只
能以严重程度、优劣等级、先后次序等表示的资料 也可应用; ③方法简便,易于理解和掌握。 缺点: 如果对符合参数检验的资料应用非参数检验,因不能 充分利用资料提供的信息,会使检验效能低于参数 检验;若要使检验效能相同往往需要更大的样本含 量。
4
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
本章主要内容
• §1 Wilcoxon 符号秩和检验 • §2 Wilcoxon 两样本比较法 • §3 完全随机设计多样本比较的
T++T- = n(n+1)/2,n为不等于0的对子数。 3.确定P值,做出推断结论
当n≤25时,以T值查“附表10 T界值表”(配对设计
用),若检验统计量T值在T界值范围内,则P值大于 相应的概率水平;若T值在T界值范围外或等于界值, 则P值小于或等于相应的概率水平。
9
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
2
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
非参数检验(nonparametric test)
• 对总体分布不作严格假定,又称任意分布检验
非参数检验教学课件
![非参数检验教学课件](https://img.taocdn.com/s3/m/bd840740a7c30c22590102020740be1e650ecc88.png)
如果多个配对样本得分布存在显著得差异, 那么数值普遍偏大得组秩和必然偏大,数值普 遍偏小得组,秩和也必然偏小,各组得秩之间就 会存在显著差异。如果各样本得平均秩大致相 当,那么可以认为各组得总体分布 没有显著差 异。
2、多配对样本得Kendall协同系数检验
多配对样本得Kendall协同系数检验和 Friedman检验非常类似,也就是一种多配对样 本得非参数检验,但分析得角度不同。多配对 样本得Kendall协同系数检验主要用在分析评 判者得判别标准就是否一致公平方面。她将每 个评判对象得分数都看作就是来自多个配对总 体得样本。一个评判对象对不同被判定对象得 分数构成一个样本,其零假设为:样本来自得多 个配对总体得分布无显著差异,即评判者得评 判标准不一致。
非参数检验教学课件
但许多调查或实验所得得科研数据,其总 体分布未知或无法确定。因为有得数据不就是 来自所假定分布得总体,或者数据根本不就是 来自一个总体,还有可能数据因为某种原因被 严重污染,这样在假定分布得情况下进行推断 得做法就有可能产生错误得结论。此时人们希 望检验对一个总体分布形状不必作限制。
非参数检验根据样本数目以及样本之间得关系 可以分为单样本非参数检验、两独立样本非参数检 验、多独立样本非参数检验、两配对样本非参数检 验和多配对样本非参数检验几种。
6、1 SPSS单样本K-S检验
6、1、1 统计学上得定义和计算公 式 定义:单样本K-S检验就是以两位前苏联数
学家Kolmogorov和Smirnov命名得,也就是一种 拟合优度得非参数检验方法。单样本K-S检验 就是利用样本数据推断总体就是否服从某一理 论分布得方法,适用于探索连续型随机变量得 分布形态。
Kendall协同系数检验中会计算Friedman 检验方法,得到friedman统计量和相伴概率。 如果相伴概率小于显著性水平,可以认为这10 个节目之间没有显著差异,那么可以认为这5个 评委判定标准不一致,也就就是判定结果不一 致。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§5.非参数检验参数检验:估计或检验总体参数统计分析方法对总体有特殊要求,如t检验要求总体符合正态分布,F 检验要求误差呈正态分布且各组方差齐等,这些方法称为参数检验。
非参数检验:数据的总体分布未知或无法确定,统计分析不是针对总体参数,而是针对总体的某些一般性假设(如总体分布)的检验方法。
5.1.1 主要功能适用于有明显分类特征的某些数据,主要用于检验属于某一类的对象或实际观测数与根据某理论假设所期望的频数间是否有显著差异。
5.1.2 实例操作例5-1某地一周内各日死亡数的分布如下表,请检验一周内各日的死亡危险性是否相同?星期一二三四五六日死亡数11 19 17 15 13 16 195.1.2.1 数据准备在数据编辑器窗口,定义变量名:各日为Day,死亡数为Death。
按顺序输入数据,结果见死亡危险性.sav。
1.Data菜单→Weight Cases...命令项→弹出Weight Cases对话框;2.核选weight cases by,选Death并点击【➢】钮使之进入Frequency框,定义死亡数为权数;3.再点击OK钮即可。
13.1.2.2 统计分析步骤1.Statistics菜单→Nonparametric Tests…→Chi-Square...命令项→弹出Chi-Square Test对话框。
2.从变量名列表框中选变量(Day)并【➢】移入到Test variable框中,则对其对应的数据进行检验。
其他选项的意义:Expected Range栏: 确定对变量中的那些数据进行检验。
◎Get from data: 全部数据参与检验(默认)。
◎Use specified range: 确定自定义的下限和上限。
Expected Values:◎All categories equal: 假设变量中各组数据的期望值相等(默认)。
检验服从均匀分布时选此项。
◎Values: 窗口中输入数值→Add,移入到右侧框中,重复可以输入多个数值,它们将被作为需要检验分布的期望值。
Exact钮→弹出Exact Test对话框:◎Asymptotic only: 缺省,根据假设的分布采用渐进逼近方法计算显著性。
◎Monte Carlo: 设置置信度和最大迭代次数。
◎Exact: 设置计算时间限制。
>30mins时,建议用Monte Carlo法。
Option钮→弹出Chi-Square Test: Options对话框: 设置描述统计量和缺失值处理方法。
3.点击OK钮即可。
注:卡方检验要求所有单元中的期望值≥1,并且有20%以上的单元中的期望值≥5。
5.1.2.3 结果解释在结果输出窗口中将看到如下统计数据:运算结果显示一周内各日死亡的理论数(Expected)为15.71,即一周内各日死亡均数;还算出实际死亡数与理论死亡数的差值(Residual);卡方值χ2 = 3.4000,自由度df= 6 ,P = 0.7572 ,可认为一周内各日的死亡危险性是相同的。
DAYObserved N Expected N Residual1 11 15.7 -4.72 19 15.7 3.3…………7 19 15.7 3.3Total 110Test StatisticsDAYChi-Square 3.400df 6Asymp. Sig. .757a 0 cells (.0%) have expected frequencies less than 5.The minimum expected cell frequency is 15.7.例5-2掷骰子120次,记录各点数出现的频数于下表,以检验骰子各点出现的频数是否服从均匀分布?数据记录于文件掷骰子.sav。
(先要给频数加权,检验点数)点数 1 2 3 4 5 6频数15 15 20 21 23 265.2 Binomial检验5.2.1 主要功能从只能划分为两类的数据总体中抽取的所有可能结果,要么是对立分类中的一类(比例为P),要么是另一类(比例为1-P),则二项检验可检验能否认为从样本观察到的两类比例来自具有指定P值的总体。
5.2.2 实例操作例5-3某地某一时期内出生40名婴儿,其中女性12名,男性28名。
问这个地方出生婴儿的性比例与通常的男女性比例(总体概率约为0.5)是否不同?5.2.2.1 数据准备在数据编辑器窗口,定义变量和变量标签。
按出生顺序输入数据,婴儿性比.sav。
5.2.2.2 统计分析1.Statistics菜单→Nonparametric Tests...→Binomial...命令项→弹出Binomial Test对话框;2.Test Variable框:将变量名列表框中的待分析变量(婴儿),【➢】移入到该框;3.Define Dichotomy框:确定数据获取方式。
◎Get from data: 从原数据文件获取分类数据;◎Cut point: 输入一个数值,将以该值为界将原数据分为2组(依变量标签值确定,如0.5,1或1.5等)。
4.在Test框:键入数值(缺省为0.5)作为二项中属于第一项的概率,其他同前;5.点击OK钮即可。
Binomial TestCategory N Observed Prop. Test Prop. Asymp. Sig. (2-tailed) Baby Group 1 0=男孩28 .70 .50 .018Group 2 1=女孩12 .30Total 40 1.00a Based on Z Approximation.5.2.2.3 结果解释在结果输出窗口中将看到如下统计数据:二项分布检验表明,女婴12名,男婴28名,观察概率为0.7000(即男婴占70%),检验概率为0.5000,二项分布检验的结果是双侧概率为0.0177,可认为男女比例的差异有高度显著性,即与通常0.5的性比例相比,该地男婴比女婴明显为多。
5.3 Runs检验5.3.1 主要功能SPSS应用游程总个数检验方法,检验一组数据是否来自同一总体或差异不明显,服从同一分布。
既考察按随机顺序得到的一组样本的观测值是否表现出足够的随机性。
5.3.2 实例操作例5-4某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户标记为“1”,对非发病的住户标记为“0”,共26户:0 1 1 0 0 0 1 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0 1 0 1问病户的分布排列是呈聚集趋势,还是随机分布?13.3.2.1 数据准备激活数据管理窗口,定义住户变量为地方病。
按住户顺序输入数据,发病的住户为1,非发病的住户为0。
地方病.sav13.3.2.2 统计分析1.Statistics菜单→Nonparametric Tests→Runs Test...项→弹出Runs Test对话框。
2.将变量名列表框中endemic【➢】移入Test Variable框。
在临界割点Cut Point框中有四个选项:□Median:用数据中位数作断点(缺省);□Mode:用众数作临界割点;□Mean:用均数作临界割点;□Custom:用指定值作临界割点;本例选Custom项,在其方框中键入1(本例是0、1二分变量,故临界割点值用1)。
3.其他按照卡方检验设置,点击OK。
5.3.2.3 结果解释在结果输出窗口中将看到如下统计数据:检验结果可见本例游程个数为14,检验临界割点值(Test value)= 1.00,小于1.00者有17个案例,而大于或等于1.00者有9个案例。
Z = 0.3246,双侧P = 0.7455。
所以认为此地方病的病户沿河分布的情况无聚集性,而是呈随机分布。
Runs TestendemicTest Value 1Total Cases 26Number of Runs 14Z .325Asymp. Sig. (2-tailed) .746a User-specified.5.4 1-Sample K-S检验5.4.1 主要功能对单样本进行Kolmogorov-Smirnov Z检验,它将一个变量的实际频数分布与正态分布(Normal)、均匀分布(Uniform)、泊松分布(Poisson)进行比较。
5.4.2 实例操作例5-5某地成年男子144人红细胞计数(万/立方毫米)的频数资料如下,问该资料是否呈正态分布?红细胞计数人数红细胞计数人数420- 440- …520- 24…25540-560-…640-2422…15.4.2.1 数据准备在数据编辑器窗口,定义频数变量名为频数,依次输入人数资料,红细胞频数.sav。
5.4.2.2 统计分析1.Statistics菜单→Nonparametric Tests→1-Sample K-S ...项→弹出One-Sample Kolmogorov-Smirnov Test框。
2.在变量名列表框中选f,点击【➢】使之移入Test Variable框;3.在Test Distribution框中有4个选项(Normal, Uniform, Poisson, Exponential),表明与这些分布形式相比较,再点击OK钮即可。
5.4.2.3 结果解释在结果输出窗口中将看到如下统计数据:K-S正态性检验的结果显示,Z值=0.718,双侧P值=0.681,可认为该地正常成年男子的红细胞计数符合正态分布。
One-Sample Kolmogorov-Smirnov Test频数N 12Normal ParametersMean 12.08 Std. Deviation 9.32Most Extreme Differences Absolute .207 Positive .207 Negative -.163Kolmogorov-Smirnov Z .718b Calculated from data.例5-6在一大批相同型号的电子元件中随机抽取10只作使用寿命(h)试验,测得结果如下:420 500 920 1380 1510 1650 1760 2100 2320 2350。
试问该电子元件的使用寿命是否服从均值为1500h的指数分布?元件寿命.savOne-Sample Kolmogorov-Smirnov Test使用寿命N 10Exponential parameter. Mean 1491.0000Most Extreme Differences Absolute .304 Positive .207 Negative -.304Kolmogorov-Smirnov Z .960Asymp. Sig. (2-tailed) .315a Test Distribution is Exponential.b Calculated from data.注:缺省时系统将样本数据的均值作为指数分布的均值,如表中所示,P值大于0.05故接受零假设,即服从均值为1491的指数分布。