非参数假设检验-第四次课新
非参数检验课件
13.71
5
19.61
24.37
4.76
6
14.50
92.75
78.25
7
49.63
121.57
71.94
8
44.56
89.76
45.20
编秩次,求秩和 去掉d=0的对子,总的对子数也要相应减去; 用绝对值︱d︳编秩次,如果出现绝对值相等时(ties) ,则将它们的平均秩次值作为他们的秩次;
第二节 单样本资料的符号秩和检验
• 目的:推断样本中位数与已知总体中位数 (常为标准值或大量观察的稳定值)有无 差别,常用于不满足单样本t检验应用条 件的资料;其检验假设是M=M0.
• 例10-2 已知某地正常人尿氟含量的中位 数为2.15mmol/L.今在该地某厂随机抽取 12名工人,测得尿氟含量,结果见表2。 问该工厂的尿氟含量是否高于当地正常人 ?
参数检验方法
• t检验 两独立样本t检验要求:正态、方差相等、个体独立 配对t检验要求:差值正态、个体独立
• 方差分析 完全随机设计方差分析要求:正态、方差相等、个体独 立
参数检验方法
• 两组性别结构是否相同?
• 两组某种不良反应的发生率是否相同?
• 多组发生率是否相同? • 多组构成是否相同?
定性无序分 类资料
未解决的问题
• 疗效用痊愈、显效、有效、无效四级分类法进行 评价时,两组或多组如何比较?
• 对两组患者空腹胰岛素水平进行比较时,有的病 例测量结果为Ins<2.0 或Ins>300,如何处理?
未解决的问题
• 对应于多分类变量(有序) • 非正态分布 • 不完整数据:如,Ins<2.0 或Ins>300 • 正态分布但方差不相等时
数学建模方法-非参数假设检验
两相关样本的非参数检验(2 Related Samples Test)
【例12】clinical trial.sav 比较试验药组(group=1) 治疗前血红蛋白含量(hb1)和治疗后血红蛋白含量(hb2) 有无差异.
这是两组相关计量资料的比较. 结论:P=0.018,有显著性差异.
多个相关样本的非参数检验(K Related Samples Test) 【例13】nonpara_7.sav 分析药物是否有效
两相关样本的非参数检验(2 Related Samples Test) 多个相关样本的非参数检验(K Related Samples Test)
两独立样本的非参数检验(2 Independent Samples Test) 检验两个独立样本间是否具有相同的分布. 【例8】nonpara_3.sav 比较两组人群的RD值有无差别 这是两组计量资料的比较. 选择要检验的变量和分 类变量,定义分类值(1-2),其它使用默认选项即可.从负二项分 布的结论.
单样本的K_S拟合优度检验
检验一计量资料是否服从某种理论分布,这里的分布可以 是正态分布(Normal),均匀分布(Uniform),泊松分布(Poisson), 指数分布(Exponential).
【例7】diameter_sub.sav 检验是否服从正态分布
多个独立样本的非参数检验(K Independent Samples Test) 【例10】nonpara_5.sav 比较三种药物的效果有无差别 这是三组计量资料的比较. 选择要检验的变量和分 类变量,定义分类值(1-3),其它使用默认选项即可. 结论:三组的秩和12.6,7.6,3.8,P=0.008,三种药物的 效果有显著性差异,以甲药效果最好. 【例11】nonpara_6.sav 比较三种固定钉治疗骨折的疗效 这是三组等级/频数资料的比较. 先说明频数变量, 再选择要检验的变量和分类变量,定义分类值(1-3),其它 使用默认选项即可. 结论:P=0.129,故三组无显著性差异.
非参数假设检验.pptx
计算每分钟内通过收费站的汽车为0辆、1辆、2辆、3 辆、4辆或更多的概率。
第12页/共43页
e 各概率乘以观测总数n=100,便得到理论频数 ,具体结果见下表: i ei
计算 2统计量的值:
2 (14.96 10)2 (28.42 26)2 (27.0 35)2
H0 :汽车通过收费站的辆数服从泊松分布; H1 :不服从泊松分布。
观测值分为5组,且有 u0 10,u1 26,u2 35,u4 5
第11页/共43页
回忆泊松分布
P{X x} e x , x 0,1, 2,
x!
其中 为泊松分布的期望值,是未知的,需要用样
本观测值来估计。由于100分钟内观测到190辆汽车, 所以平均每分钟观测到190/100=1.9辆汽车,故
第9页/共43页
计算 2统计量的值:
2 6 (ui ei )2
i1
ei
(27 25)2 (18 25)2 (15 25)2 (24 25)2
25
25
25
25
(36 25)2 (30 25)2 12
25
25
在本例的情况下, 统2 计量的自由度为m-1=6-1=5。
第8页/共43页
解:本例中的观测值以月为组,共分为m=6组,
每 月的销售台数即为观测的频v数i ,观测的总次
数为n=150。现欲检验是否服从(离散的)均匀 分布,即每月的销售量是否为
ei
nPi
150 6
25(台),
Pi
1 6
,i
1,
,6
为此,设
H0 :洗衣机销售量服从均匀分布;
H1 :并不服从均匀分布;
第四讲——非参数检验
• •
2 拟合优度检验原理以及计算
类别 观测频数 1
O1
2 …. K
总和
O2
OK
n
假设检验问题:
H0 : F(X) F0 (X) H1 : F(X) F0 (X)
观测频数 O 和理论频数 E 的差别作为检验总体分 布和理论分布是否一致的标准,定义Pearson 2 统计量: 2 2
非参数检验方法
•第一节 非参数检验的一般问题 •第二节 单样本非参数检验 •第三节 列联表与 的独立性检验 •第四节 等级相关分析 •第五节 两个相关样本的非参数检验 •第六节 两个独立样本的非参数检验 •第七节 多个相关样本的非参数检验 •第八节 多个独立样本的非参数检验
2
第一节 非参数检验的一般问题
1
2
1
2
第三节 列联表与 的独立性检验
2
连列表又称交互分类表,指抽自某一总体的样本同时按照两个或
两个以上标志进行分类,一下以量个分类标志位例。
[例]下表是一个由220名饮酒者组成的随机样本,对饮酒者 进行酒的类型偏好的调查。横向看,反映了再固定性别 的条件下,对白酒与啤酒的偏好;总向看,反映了再固 定酒类型的条件下,各性别的人数。
性别 男性 女性 合计
饮酒偏好 白酒 啤酒 60 50 40 70 100 120
合计 110 110 220
直观看似乎饮酒偏好 与性别有关,是这样 吗?利用 统计量可 以完成对分类数据或 顺序数据之间是否独 立的检验。
• 建立假设:Ho:两个分类变量之间独立(性别与饮酒偏好无关);
•
• 从参数检验的前提条件看,仅要求观察值是独立的、变 非参数检验方法的特点
•
•
假设检验——非参数检验
假设检验(二)——非参数检验假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。
上一节我们所介绍的Z 检验、t 检验,都是参数检验。
它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。
参数检验就是要通过样本统计量去推断或估计总体参数。
然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。
这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。
非参数检验是通过检验总体分布情况来实现对总体参数的推断。
非参数检验法与参数检验法相比,特点可以归纳如下:(1)非参数检验一般不需要严格的前提假设;(2)非参数检验特别适用于顺序资料;(3)非参数检验很适用于小样本,并且计算简单;(4)非参数检验法最大的不足是没能充分利用数据资料的全部信息;(5 )非参数检验法目前还不能用于处理因素间的交互作用。
非参数检验的方法很多,分别适用于各种特点的资料。
本节将介绍几种常用的非参数检验方法。
一.2检验2检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。
22检验的方法主要包括适合性检验和独立性检验。
(一)2检验概述2是实得数据与理论数据偏离程度的指标。
其基本公式为:2 ( f0 f e)(公式11—9)fe式中,f0 为实际观察次数,f e 为理论次数。
分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2。
观察公式可发现,如果实际观察次数与理论次数的差异越小, 2值也就越小。
当 f 0 与 f e 完全相同时,2值为零。
际次数与理论次数之差的大小而变化利用2值去检验实际观察次数与理论次数的差异是否显著的方法称为2检验有两个主要的作第一,可以用来检验各种实际次数与理论次数是否吻合的这类问题统称为适合性检验; 第二, 判断计数的两组或多组资料是否相互关联还是相互独立的问 题,这类问题统称为独立性检验。
非正态总体参数的假设检验和非参数检验
分布类型,此时F0可能含有未知参数,
上述方法不再适用。此时若要检验假
设
H0 : F (x) F0 (x;1,L ,,m由) 于
未于知 是pi0,可故以上用述估检计验量法(不极能大直似接然使估用计,)
来代替未知参数。
此时的统计量为
2 r (ni npˆi0 )2 .
i 1
npˆ i0
当n充分大时,上述统计量近似服
服从多项分布。
由大数定律知,当n充分大时,频 数ni与理论频数npi越来越小。故ni 与npi之间的差异可以反映出概率分 布 ( p1, p2,L , pr )是否为总体的真实分 布。令
2 r (ni npi )2
i1
npi
称上述统计量为皮尔逊统计量。
定理(皮尔逊定理)设总体的真实 分布为( p1, p2,L , pr ) ,则有
实际上,还可以用皮尔逊统计量检 验任意的一个总体是否具有某个指 定的分布函数 F0 (x)。
若我们要检验假设 H0 : F (x) F0 (x). 可选取r-1个不相等的实数 y1 L yr1 把实数轴分成r个区间,令
p1 F ( y1), pi F ( yi ) F ( yi1),i 2,L , r 1, pr 1 F ( yr1).
缺点:由于采用分组处理样本,实 际上检验的只是若干特殊点的值, 这就导致很可能犯第二类错误(取 伪错误)。
2. Kolmogorov检验法
出发点:考虑经验分布函数 Fn*(x) 和原假设H0 : F (x) F0 (x)成立时总 体分布函数之间偏差的最大值。
2 ~& 2 (r 1)
由上述定理,当样本容量较大时,
统计量 2近似服从自由度为r-1的卡
方分布。
《非参数检验方法》课件
用于比较两个独立样本的中位数是否相等。
用于比较三个或多个独立样本的中位数是 否相等。
3 Wilcoxon符号秩检验
4 Friedmann检验
用于比较两个相关样本的中位数是否相等。
用于比较三个或多个相关样本的中位数是 否相康型”饮料,是否对销售额产生显著影响?
使用 Mann-Whitney U检验来比较推出“健康型”饮料前后的销售额差异。
案例2:针对不同年龄段顾客的购物偏好是否存在差异?
使用 Kruskal-Wallis H检验来分析不同年龄段顾客的购物偏好是否有显著差异。
总结
非参数检验方法的应用场景和局限性。非参数检验方法的总体流程。非参数 检验方法的意义及应用前景。
《非参数检验方法》PPT 课件
非参数检验方法PPT课件
简介
什么是非参数检验方法?为什么需要非参数检验方法?非参数检验方法的优 势和劣势。
基本原理
什么是假设检验?什么是零假设和备择假设?非参数检验方法与参数检验方 法的区别。
常见的非参数检验方法
1 Mann-Whitney U检验
2 Kruskal-Wallis H检验
非参数检验
➢ 编秩:数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重(kg)xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验 (Friedman test)
正态近似法
如果n1或n2-n1超出附表的范围,可按下式 计算u值:
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时,应用下式进行校正:
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料(或等级资料)两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分 差 值
非参数检验方法 PPT课件
对于符合参数统计分析条件者,采用 非参数统计分析,其检验效能较低
秩和检验
秩和检验(rank sum test):一类常用 的非参数统计分析方法;基于数据的秩次与 秩次之和
两独立样本差别的秩和检验 配对设计资料的秩检验 完全随机设计多组差别的秩和检验
两独立样本比较的秩和检验 Wilcoxon rank sum test
n1=8 T1=216 n2=7
21 26 24 27
T2=134
11.7 11.7 12.0 12.3 12.4 13.6
n3=9
14 15 16 16 20 25
T3=123.5
10.5 10.5 10.5 10.9 11.0 11.5
n4=8
6 7 9 10 12
T4=54.5
假设检验步骤
建立假设检验 • H0:四组鼠脾DNA含量的总体分布相同。 • H1:四组鼠脾DNA含量的总体分布位置不全相
第九章
非参数检验方法
参数统计
(parametric statistics)
已知总体分布类型,对 未知参数(μ、π)进 行统计推断
依赖于特定分布类 型,比较的是参数
非参数统计
(nonparametric statistics)
对总体的分布类 型不作任何要求
不受总体参数的影响, 比较分布或分布位置
适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
对于计量数据,如果资料方差相等,且服从 正态分布,就可以用 t 检验比较两样本均数。
如果此假定不成立或不能确定是否成立,就 应采用秩和时间(月)
无淋巴细胞转移
有淋巴细胞转移
时间
秩次
时间
秩次
非参数统计第四章多样本数据检验
第四章多样本数据检验在参数检验中,我们常常对三个或三个以上的总体的均值进行相等性检验,使用的方法是方差分析。
方差分析过程需要假定条件,F检验才有效。
可有时候所采集的数据常常不能满足这些条件。
像两样本比较时一样,我们不妨尝试将数据转化为秩统计量。
在非参数分析中也会遇到同样的问题,检验多个总体的分布是否相同。
更严密的说,当几个总体的分布相同的条件下,讨论其位置参数是否相等。
因为秩统计量的分布与总体分布无关,可以摆脱总体分布的束缚。
第一节 Kruskal-Wallis检验正态总体:第一节 Kruskal-Wallis检验基本原理:与处理两样本位置检验的W-M-W方法类似,将多个样本混合起来求秩,如果遇到打结的情况,采用平均秩,然后再按样本组求秩和。
将 k 组数据混合,并从小到大排列,列出等级,如有相同数据则取平均等级,如果原假设为不真,某个总体的位置参数太大,则其观测值也倾向于取较大的值,则该总体的观测值的秩和也会偏大。
一般总体:检验方法计算第i组的样本平均秩:对秩依照正态总体中MST的结构,得到Kruskal-Wallis的H统计量:在零假设情况下,H近似服从,当的时候拒绝零假设,p值为P(H≥h)。
大样本近似[例]为研究4种不同药物对儿童咳嗽的治疗效果,将25个体质相似的病人随机分为4组,各自采用A/B/C/D四种药物进行治疗,假定其他条件均保持相同。
5天后测量每个病人每天咳嗽次数如下,试比较这4种药物的治疗效果是否相同。
多重比较对比其中每两组差异的时候,用Dunn(1964)年提出用:其中如果那么表示i和j两组之间存在差异,,为标准正态分布分位数。
本节软件的注kw3>.test=function(m1=5,m2=5,m3=4,Hvalue=9.4114){m<-m1+m2+m3;Jh5=function(m){a<-rep(0,5);for(i in 1:(m-4)){for(j in (i+1):(m-3)){for(k in (j+1):(m-2)){for(l in (k+1):(m-1)){for(f in (l+1):m){a<-rbind(a,c(i,j,k,l,f))}}}}};a[2:nrow(a),]};JTid1<-Jh5(m1+m2+m3);n1<-nrow(JTid1);JTid2<-Jh5(m2+m3);n2<-nrow(JTid2);nn<-n1*n2;const<-1:m;y<-0;for(i in 1:n1){for(j in 1:n2){temp1<-c(JTid1[i,]);temp2<-(const[-temp1])[c(JTid2[j,])];temp3<-const[-c(temp1, temp2)];y<-c(y,12/(m*(m+1))*((sum(temp1))^2/m1+(sum(temp2))^2/m2+(sum(temp3))^2/m3)-3*(m+1))}};y<-y[2:(nn+1)];pvalue<-(sum(y>=Hvalue))/nn;y<-sort(y) ;aaa<-aa<-y[1];tempc<-1;for(i in 2:nn){if ((y[i]-aa)>10^{-12}){aaa<-c(aaa,y[i]);aa<-y[i];tempc<-c(t empc,1-(i-1)/nn)}};out<-cbind(aaa,tempc);List(c(;(m1,m2,m3); =c(m1.m2,m3), ;H; =Hvalue, ;pval; =pvalue),out)}改进kw.test=function(m1=5,m2=5,m3=4,Hvalue=9.4114){m<-m1+m2+m3;Jh5=function(m){a<-rep(0,5);for(i in 1:(m-4)){for(j in (i+1):(m-3)){for(k in (j+1):(m-2)){for(l in (k+1):(m-1)){for(f in (l+1):m){a<-rbind(a,c(i,j,k,l,f))}}}}};a[2:nrow(a),]};JTid1<-Jh5(m1+m2+m3);n1<-nrow(JTid1);JTid2<-Jh5(m2+m3);n2<-nrow(JTid2);nn<-n1*n2;const<-1:m;y=matrix(0,ncol=nn, nrow=1)for(i in 1:n1){for(j in 1:n2){temp1<-c(JTid1[i,]);temp2<-(const[-temp1])[c(JTid2[j,])];temp3<-const[-c(temp1,temp2)];y[(i-1)*n2+j]<-12/(m*(m+1))*((sum(temp1))^2/m1+(sum(temp2))^2/m2+(sum(temp3))^2/m3)-3*(m+1)}};pvalue<-(sum(y>=Hvalue))/nn;y<-sort(y);aaa<-aa<-y[ 1];tempc<-1;for(i in 2:nn){if ((y[i]-aa)>10^{-12}){aaa<-c(aaa,y[i]);aa<-y[i];tempc<-c(t empc,1-(i-1)/nn)}};out<-cbind(aaa,tempc);list(c(;(m1,m2,m3); =c(m1.m2,m3), ;H; =Hvalue, ;pval; =pvalue),out)}第二节正态记分检验*本节软件的注第三节 Jonckheere-Terpstra 检验在上一节中,我们只是考虑了备选假设无方向时的秩检验法,而在实际中有许多问题,其备选假设可能是有方向的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Monte Carlo:不依赖渐进性方法估测精确显 著性,这种方法在数据不满足渐进性分布,而 且样本数据过大以致不能计算精确显著性时特 别有效。
Exact:精确计算法,即准确计算观测结果的 统计概率。计算量较大,适用于小样本。
Test Value a Total Cases Number of Runs Z Asymp. Sig. (2-tailed)
a. User-specif ied.
发病 情况 1.00 35 14
-1. 339 .181
单样本的Kolmogorov—Smirnov检验
单样本K—S检验是一种拟合优度的非参数检 验,是利用样本数据推断总体是否服从某一理论 分布的方法,适用于探索连续性随机变量的分布 形态。进行Kolmogorov-Smirnov Z检验,是将一 个变量的实际频数分布与正态分布(Normal)、均 匀分布(Uniform)、泊松分布(Poisson)进行比较。
练习:赛马比赛时,任一马的起点位置是起跑 线上所指定的标杆位置。现有8匹马的比赛,位 置1是内侧最靠近栏杆的跑道,位置8是外侧离栏 杆最远的跑道,下表是某赛马在一个月内某特定 圆形跑道上的纪录,并且按照起点的标杆位置分 类。试检验起点标杆位置对赛马结果的影响。
马在8个圆形跑道的起点标杆位置上获胜的纪录
依时间或其他顺序排列的有序数列中,具有 相同的事件或符号的连续部分称为一个游程。调 用Runs过程可进行游程检验,即用于检验序列中 事件发生过程的随机性分析。
例题
例题:某村发生一种地方病,其住户沿一条河排 列,调查时对发病的住户标记为“1”,对非发病 的住户标记为“0”,共20户,其取值如下表所示 :
对于多数参数检验方法,都有一种或几种 相对应的非参数检验方法,如下表所示。
参数检验与非参数检验方法的对应表
参数检验方法
t检验法
t检验法 (配对样本) 单因素方差分析 多因素方差分析
相关系数
非参数检验方法 两个独立样本的中位数检验
两个独立样本的秩和检验 成对比较、单样本正负号检验 成对比较、单样本符号秩检验
非参数假设检验-第四次课新
单击此处添加副标题内容
非参数假设检验
追求
非参数检验是相对于参数检验而言的,这两 种检验方法在实际中都有广泛的应用,但它们有着 不同的数理统计原理和应用场合。
在统计学的发展过程中,最先出现的推断统 计方法都对样本所属总体的性质作出若干假设,即 对总体的分布形状作某些限定,例如Z检验、t检验, 假设样本的总体分布加以某些限定,把所要推断的 总体数字特征看作未知的“参数”进行推断,称之 为参数统计方法(Parameter statistical methods) 或限定分布统计方法(distribution-specified statistical methods),基于此所做的假设检验就称 为参数检验(Parametric test)。常用的检验如t检 验、Z检验、F检验等都是参数检验。
2 k (f0 fe)2
i1
fe
例题
例题:某地一周内每日患忧郁症的人数如表 所示,请检验一周内每日人们忧郁的数是否满足 1:1:2:2:1:1:1。
周日 1
患者数 31
SPSS实现 过程
2
38 1.定义变量;
3
70 2.变量加权;
4
80 3.进入Analyze菜单
5
29
6
24
7
31
用于选择计算非参数检验统计量对应的P值 的方法。SPSS提供了3种计算P值的方法:
独立样本非参数检验 多个总体 配对样本非参数检验
一个总体分布的检验
检验总体的正态分布 检验总体的卡方分布 检验总体的二项分布 单样本变量值的随机性检验(游程检验) 单样本的Kolmogorov—Smirnov检验
检验总体的正态分布的图示法
P-P正态概率分布图(Graphs P-P) 是根据变量的累计比例对所指定的理论分布累 计比例绘制的图形。 Q-Q正态概率单位分布图(Graphs Q-Q)
1
起点标杆位置 2 3 4567
8 总数
获胜 频数
29
19
18
25 17 10 15 11
144
均匀分布检验
检验总体的二项分布
二项分布检验的基本思想:根据搜集到的样 本数据,推断总体分布是否服从某个指定的二项 分布。
其零假设:样本来自的总体与所指定的某个 二项分布不存在显著的差异。
SPSS中的二项分布检验,在样本小于等于30 时,按照计算二项分布概率的公式进行计算;样 本数大于30时,计算的是Z统计量,认为在零假 设下,Z统计量服从正态分布。
例题
例题:某地144个周岁儿童身的高数据如下表, 问该地区周岁儿童身高频数是否成正态分布?
身高区间
人数
64—
2
68—
4
69—
7
70—
16
71—
20
72—
25
73—
24
74—
22
76—
16
78—
2
79—
6
83—
1
One-Sample Kolmogorov-Smirnov Test
N Normal Parameters a,b
参数检验只有在关于总体分布的假设成立时,所 得出的结论才是正确的,所以它在很多场合不便 应用,于是统计学家发展了许多对总体不作太多 或严格限定的统计推断方法,这些方法一般不涉 及总体参数的假设,与之相对应的统计方法通常 称为非参数统计(Nonparametric statistics)或 自由分布统计方法(Distribution-free statiscal methods),基于此所做的假设检验则称为非参 数检验(Nonparametric test)或自由分布统计 检验(Distribution-free statistical test)。非参 数检验的前提假设比参数检验方法少很多,也容 易满足,适用于已知信息相对较少的数据资料, 而且它的计算方法也简便易行。
df
6
As ymp. Sig. .331
a.0 cells (.0%) have expected frequencies les s than 5. The minimum expected cell frequency is 33.7.
卡方检验要求样本量是充分大的,使用时建 议样本容量应该不小于30,同时每个单元中 的期望频数不能太小,如果有类别的频数小 于5,则建议将它与相邻的类别合并,如果有 20%的单元期望频数都小于5,就不能再使用 卡方检验了。
非参数假设检验需要处理的问题:
(1)猜出总体的分布(假设),用另一组样本检验。
(2)两个总体的分布未知,它们是否相同;
一个总体分布的非参数假设检验 内容 两个总体分布的非参数假设检验
多个总体分布的非参数假设检验
一个总体:单样本总体分布的检验
SPSS的
独立样本非参数检验 两个总体
非参数检验
配对样本非参数检验
K个独立样本的H检验法 Friedman 检验法
Spearman 秩相关系数
非参数检验的优点
与参数检验方法对比,非参数检验方法具有以下优点: ▪ 检验条件宽松,适应性强。参数检验假定总体分布为
正态、近似正态或以正态分布为基础而构造的t分布或 分2 布;非参数检验不受这些条件的限制,弥补了参数 检验的不足,对于非正态的、方差不等的以及分布形 状未知的数据都适用。 ▪ 检验方法灵活,用途广泛。非参数检验不但可以应用 与定距、定比等连续变量的检验,而且适用于定类、 定序等分类变量的检验。对于那些不能直接进行四则 运算的定类数据和定序数据,运用符号检验、符号秩 检验都能起到好的效果。 ▪ 非参数检验的计算相对简单,易于理解。由于非参数 检验更多地采用计数的方法,其过程及结果都可以被 直观地理解,为使用者所接受。
续
35家住户的发病情况
住户 发病情况 住户 发病情况 住户
1
1
13
1
25
2
0
14
1
26
3
1
15
1
27
4
1
16
1
28
5
1
17
0
29
6
1
18
0
30
7
0
19
1
31
8
0
20
1
32
9
0
21
0
33
10
0
22
0
34
11
1
23
1
35
12
1
24
1
发病情况
1 1 0 1 0 0 1 0 0 0 0
Runs Test
Category N
Prop.Test Prop(2. -tai led)
性 别Group 1 1
16
.46
.50
.736a
Group 2 0
19
.54
Total
35
1.00
a.Based on Z Approximati on.
单样本变量值的随机性检验(游程检验)
单样本变量值的随机性检验是对某变量的取 值出现是否随机进行检验,也称游程检验。
周日
Hale Waihona Puke Observ ed N Expected N Residual
1
31
33.7
-2.7
2
38
33.7
4. 3
3
70
67.3
2. 7
4
80
67.3