应用统计学 第10章 卡方检验和非参数检验

合集下载

非参数检验卡方检验

非参数检验卡方检验

三、命令语句 NPAR TEST /CHISQUARE=检测变量 /EXPECTED=对应的期望频数 /MISSING ANALYSIS. 四、应用举例 某地区的人口消费结构在83年和90年的统计数字如下:
食品
衣物
住房
燃料
日用品
非商品支
出 83年 53 12.8 11.7 5.6 14.1 2.8 90年 44.2 10.8 15.1 4.7 16.2 9.0 建立一个数据文件:变量cost 为44个1、11个2、15个 3、16个5、9个6 检测变量:cost 期望值定义:53 13 12 6 14 3 分析结果:Asymp.sig=.010,所以85年的消费结构同 90年的消费结构差异显著。
二项分布检验 一、二项分布检验概念 对于某分布,假定低于某指定值V的百分比占P0。如 果该假设成立,则分布将满足一个规律。 H0假设:样本组中低于等于某值V的个案占百分比P0。 二、操作步骤 执行: [Analyze][Nonparametric][Binomial] 选择变量(必须是数值型变量)到Test Variables检验变 量窗口 定义分界值“Define Dichotomy”: “Get from data”为自动分界,即变量值中只有两类 数值。 “Cut point”定义分界值,检验小于该值的观测值。 “Test”定义检验百分比,例如:.10 , .50或 .75等。
“Exact”可以定义各种不同分布下的显著性检验, 使计算更精确: “Asymptotic only”适合于渐进分布的大样本分 布。 “Monte Carlo” 适合不满足渐进分布的大样本分 布。 “Confidence”指定置信区间。 “Number of”指定近似法计算中的个案数。 “Exact”精确计算统计概率。 按钮“Options”中可以设置选项: 统计描述“Descriptive” 中将计算: 均值、标准差、最大值、最小值等。 “Quartiles” 四等分百分位数的计算。 缺失值“Missing Value”: “Exclude cases test by test”表示排除在做统计 分析的变量中含有缺失值的个案。 “Exclude cases listwise”表示排除在检验变量

单样本非参数检验1卡方检验【24页】

单样本非参数检验1卡方检验【24页】

(1)建立零假设和备择假设
H0 :总体分布函数为 F(x); H1 :总体分布函数不为 F(x)。
分布函数和密度函数的区别知道吧?
(2)构造和计算统计量
◆把实轴 (,分) 成 k 个不相交的区间 (,a 1 ](a ,1 ,a 2 ],,.(.a k . 1 ,, )
◆设样本观察值 x1,x2,...x,n落入每个区间的实际频数为 f i 则实际频率为 f i
因此,医学家的研究结论是正确的哦。
3.3 卡方检验的SPSS软件实现
(1)输入例子中的数据,如图所示。
切记要加权!
卡检验的SPSS操作
勾选“值”
输入2.8, 点“添加”
改成1,点“添加”, 依次进行
1个2.8,6个1,最后点 OK!
得到卡方检验结果,分两部分
死亡日期
O bserv ed N Expected N Residual
1.00
55
53.5
1.5
2.00
23
19.1
3.9
3.00
18
19.1
-1.1
4.00
11
19.1
-8.1
5.00
26
19.1
6.9
6.00
20
19.1
.9
7.00
15
19.1
-4.1
Total
168
注意:学习了卡方检验的方法和过程后,你会解读软件给 出的分析结果吗?
答案
• P值=0.256,大于显著性水平0.05,接受原 假设,认为原分布成立,即原来医生的结 论是正确的。
中,拒绝零假设,即总体不服从指定分布 F(X )
即 2 的概率P值??显著性水平

非参数卡方、单样本K-S、两个独立样本检验

非参数卡方、单样本K-S、两个独立样本检验

非参数卡方检验1.理论非参数检验是在总体分布未知或知道甚少的情况下,不依赖于总体布形态,在总体分布情况不明时,用来检验不同样本是否来自同一总体的统计方法进。

由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。

非参数检验优势:检验条件宽松,适应性强。

针对,非正态、方差不等的已及分布形态未知的数据均适用。

检验方法灵活,用途广泛。

运用符号检验、符号秩检验解决不能直接进行四则运算的定类和定序数据。

非参数检验的计算相对简单,易于理解。

但非参数检验方法对总体分布假定不多,缺乏针对性,且使用的是等级或符号秩,而不是实际数值,容易失去较多信息。

非参数卡方检验:用于检验样本数据的分布是否与某种特定分布情况相同。

非参数卡方检验通过三步检验:1.卡方统计量:X2=B 其中K 是样本分类的个数,0表示实际观测的频数,B 表示理论分布下的频数。

2.拟合优度检验:A.对总体分布建立假设。

B.抽样并编制频率分布表。

C.以原假设为真,导出期望频率。

D.计算统计量。

E.确定自由度,并查x2表,得到临界值。

F.比较x2值与临界值,做出判断。

3.独立性检验A.对总体分布建立假设。

B.抽样并编制r*c 列联表。

C.计算理论频数。

D.计算检验统计量。

E.确定自由度,并查x2表,得到临界值。

F.比较x2值与临界值,做出判断。

2.非参数卡方检验操作步骤第一步:将需检验的数据导入spss中并进行赋值后,点击分析非参数检验、旧对话框、卡方。

图2操作步骤第一步第二步:进入图中对话框后点击,首先将需检验的数据放入检验变量列表中,后在期望值选项中所以类别相等或者值(值:需要手动输入具体的分布情况)。

如果特殊情况需要调整检验置信区间,点击精确,进入图中下方对话框后点击蒙特卡洛法框里收到填入。

点击继续、确定。

图3操作步骤第二步第三步:如果需要看描述统计结果和四分位数值可以点击选项、勾选描述、四分位数。

点击继续、确实。

图4操作步骤第二步3.非参数卡方检验结果然后非参数卡方检验的描述统计、卡方检验频率表、检验统计结果就出来了。

第10章__非参数检验

第10章__非参数检验

第10章非参数检验平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。

比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。

本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。

由于这一类方法不涉及总体参数,因而称为非参数统计方法。

SPSS的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类:1、分布类型检验方法:亦称拟合优度检验方法。

即检验样本所在总体是否服从已知的理论分布。

具体包括:Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。

Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。

Runs Test:用于检验样本序列随机性。

观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。

一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。

One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission 分布和指数分布。

2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。

具体包括:Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。

Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。

第十章卡方检验描述

第十章卡方检验描述

步骤一 ( fo - fe )
步骤二
步骤三
fo (%) fe (%) 60.9 66.7
( f o - f e )² ( f o - f e )² /fe
社会学
— 5.8
33.5
0.5028
经济学
文学 信息学
76.0
61.3 69.2
66.7
66.7 66.7
9.3
— 5.4 2.5
86.5
28.9 6.4

α = 0.05
χ² = 5.1783
0
χ²α (2) = 5.99

2
卡方检验的概念
(一)卡方检验:多个总体的比较
从总体的不同类别中抽取元素构成样本,样本包含总体中各个类 别的元素,对不同类别的目标量之间是否存在显著性差异进行的检验 称为拟合优度检验。 拟合优度检验是 χ ² 检验中重要的一部分,可以同时对多个总 体进行比较。
第十章 卡方检验

卡方分布就是对样本的频数分布所来自的总体分布是否服从某种理论 分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断 总体的分布。 不同于回归分析以及 t 检验和方差分析(三者都属于参数统计), 它属于自由分布的非参数检验(非参数统计)。 它可以处理一个因素分为多种类别或多种因素各有多种类别的资料。 凡是可以应用比率进行检验的资料,都可以用卡方检验。 卡方检验是用途很广的一种假设检验方法。例如,它包括两个或多个 样本率及构成比之间的差别有无统计意义的推断,分类变量配对设计 下的卡方检验以及频数分布的拟合优度检验等。 在社会统计学中应用最多的用于分类变量之间拟合优度和独立性检验 的 χ² 检验。 χ² 检验可以判断变量之间是否相关,但,不能判断相关程度为多大。

应用统计学 第10章 卡方检验和非参数检验

应用统计学 第10章 卡方检验和非参数检验

39
40
§10.5 单因素方差分析的非参数分析:Kruskal-Wallis秩检验
如果第9章中单因素方差分析的F检验的正态 分布假设条件不符合时,可以使用Kruskal-Wallis 秩检验。Kruskal-Wallis秩检验是两独立总体 Wilcoxon秩和检验的延伸,主要用于检验项独立 总体是否有相等均值。Kruskal-Wallis秩检验和单 因素方差分析的F检验一样有效。
41
总体分布的卡方检验; 两个比例差异的卡方检验(独立样本); 两个以上比例差异的卡方检验(独立样本); 独立性的卡方检验; 两个比例差异的McNEMAR检验(相关样本); 两个独立总体的非参数检验(Wilcoxon秩和检验); 单因素方差分析的非参数检验(Kruskal-Wallis秩检验)
107 103 89 99 167 192 123 72 94 59 155 141 69 121 136 149 136 120 190 118 105 118 97 104 173 128 8 130 139 212 148 168 135 63 136 111 190 103 140 117 49 123 92 12 179 127 181 144 151 52 143 105 31 57 129 91 121 89 145 128 120 80 68 120 88 103 158 113 142 168 115 107 88 139 75 145 83 60 118 174 142 172 95 107 144 113 223 76 185 155 87 122 146 156 105 114 93 176 140 116
6
解:由表中数据,用Excel可求得 x =120.95, S2=40.582 ,故可作原假设 H0:X~ N (120,402) 将实轴划分为如下7个互不相交的区间。用Excel 的FREQUENCY函数计算数据落在各区间内的频 数,用NORMDIST函数求出各理论频数nPi ,统 计量的计算如表所示。

非参数统计讲义四卡方检验课件

非参数统计讲义四卡方检验课件
它通过卡方统计量来衡量实际观测频数与期望频数之间的差异程度,并根据卡方分布计算出p值,从而判断差异是否具有统计 学显著性。
卡方检验的步骤与公式
03
卡方检验的步骤
确定研究问题
明确研究目的,确定研究变量和 分组。
数据收集
收集相关数据,确保数据质量。
数据整理
对数据进行整理,确保数据符合 卡方检验的要求。
它通过计算卡方统计量,评估观测频 数与期望频数之间的差异是否具有统 计学显著性。
卡方检验的适用范围
卡方检验适用于分类变量,特别是当 样本量较小或数据不符合正态分布时。
它常用于检验两个分类变量之间是否 独立,或者检验一个分类变量与一个 二项分布的随机变量之间是否相关。
卡方检验的基本思想
卡方检验基于假设检验的思想,通过比较实际观测频数与期望频数来推断变量之间的关系。
非参数统计讲义四卡 方检验课件
目录
• 非参数统计概述 • 卡方检验基本概念 • 卡方检验的步骤与公式 • 卡方检验的案例分析 • 卡方检验的优缺点与注意事项
非参数统计概述
01
定义与特点
定义
非参数统计是一种统计方法,它不依 赖于任何关于数据分布的假设,而是 基于数据本身的特点进行统计分析。
特点
非参数统计具有广泛的应用范围,可 以处理各种类型的数据,并且对数据 的分布和样本大小的要求相对较低。
卡方检验的缺点
对数据要求较高
卡方检验对于数据的完整性、准确性和独立性要求较 高,否则可能导致结果失真。
对样本量要求较高
在样本量较大的情况下,卡方检验的统计效能会降低, 导致结果不够准确。
对离群值敏感
卡方检验对于离群值较为敏感,可能导致结果偏差。
卡方检验的注意事项

非参数检验(可编辑)

非参数检验(可编辑)

非参数检验第十章非参数检验* 在此前介绍的显著性检验都是基于样本的观测数据对总体参数及总体参数差异性的检验,主要包括t 检验、Z 检验、F 检验等,这些检验可统称为参数检验。

参数检验对观测值的普遍要求是总体呈正态分布。

但实际研究中,不是所有观测值都呈正态分布,或者无法确定其是否正态分布,这些情况下,参数检验技术就未必适用了,因此我们还需要掌握一些非参数检验技术,其中最为常用的就是卡方检验,它最适合于次数分布检验。

我们主要介绍卡方检验,包括总体分布的卡方检验、交叉列联表中的卡方检验、独立样本间的非参数卡方检验、配对样本间的非参数卡方检验等,同时也包含一些其它简单方便的检验方法。

卡方检验适用于次数分布的检验,比如次数分布是否与某种理想的分布一致,或者不同样本同类测量分数次数分布是否一致。

对于前者,先要确定一个理想的次数分布比例,然后将观测的某一次数分布与其比较,确定二者的差异性,并用X2 来反映。

X2 越小,则差异越小,该样本的观测分布越有可能适合于理想分布;X2 越大,则差异越大,其服从于理想分布的可能性就越小。

当服从理想分布的伴随概率小于0.05 时,就认为该次数分布与理想的分布有显著性差异。

不同样本中测量分数的次数分布使用卡方检验时,如果卡方足够大,该观测在两个样本中的次数分布服从于同一总体的概率小于0.05 时,则认为样本间存在显著性差异。

一、总体分布的卡方检验(适合性卡方检验)实例1:某商场统计了一周中七天的顾客平均数如下表所示,请问该商场一周各天的顾客数是否有显著性差异?18500 14000 13200 12200 11800 10500 15000 顾客数星期六星期五星期四星期三星期二星期一星期日解决方案(1)建立数据文件,包括两个变量:“时间”、“顾客数”;(2)打开“DATA”菜单条选中“Weight cases…”打开对话框,将“顾客数”变量加入到Frequencyvariable 框中,返回数据文件窗;(3)点击Analyze 菜单条选中Nonparametric test…中的“Chi-square…”打开对话框;(4)将“时间”变量加入“Test variables list”框中, 选中“All categories equal ;(5)点击OK 输出卡方检验结果(X2 =3022.059 ,p<.001) 。

应用统计学_卡方检验

应用统计学_卡方检验

Example: We test the null hypothesis that consumers in the target population have no preference for any of three colours of packaging.
Main display colour Observed N 26 37 27 90 Expected N 30.0 30.0 30.0 Residual -4.0 7.0 -3.0
(39 25) 2 3 25 2 3 12 . 08
2
(16 25)2 (20 25)2 (25 25)2 25 25 25
Obtain the critical value of chi square

Critical 23 = 7.82. Obtain the critical value at 5% significance level at 3 d.f., (Table E4, page 742, Berenson et.al. 2013)
Under the null hypothesis We expect 25 consumers to nominate glass, 25 to nominate plastic, 25 to nominate steel and 25 to nominate aluminium

These are the expected frequencies, Ei.
This week lecture will cover...
Analysing categorical data (nominal) Chi-square test of differences between proportions Chi-square test of independence

卡方检验与非参数检验

卡方检验与非参数检验

卡方检验与非参数检验卡方检验与非参数检验是统计学中常用的两种假设检验方法。

它们在样本数据不满足正态分布或方差齐性等假设条件的情况下,仍可以进行假设检验,因此被称为非参数检验方法。

本文将详细介绍卡方检验与非参数检验的原理、应用以及比较。

一、卡方检验卡方检验是一种用于检验两个或多个分类变量之间是否存在相关性的统计方法。

它将实际观察到的频数与期望的频数进行比较,从而判断两个分类变量是否存在相关性。

卡方检验主要包括卡方拟合度检验、卡方独立性检验和卡方配对检验等。

1.卡方拟合度检验卡方拟合度检验适用于比较观察到的频数与理论上期望的频数是否有显著差异。

例如,我们可以通过卡方拟合度检验来判断一组骰子的点数是否是均匀分布的。

该方法首先根据理论假设计算每个类别的期望频数,然后计算观察频数与期望频数的差异,并根据差异的大小判断是否有显著差异。

2.卡方独立性检验卡方独立性检验适用于比较两个分类变量之间是否存在相关性。

例如,我们可以使用卡方独立性检验来判断性别与喜好类别之间是否存在相关性。

该方法首先根据理论假设计算每个类别的期望频数,然后计算观察频数与期望频数的差异,并根据差异的大小判断是否有显著差异。

3.卡方配对检验卡方配对检验适用于比较同一组体在两个时间点或处理条件下的观测值是否有差异。

例如,我们可以使用卡方配对检验来判断一种药物在服药前后对疾病症状的治疗效果。

该方法通过比较观察值和期望值之间的差异来判断是否有显著差异。

非参数检验是一种不依赖于总体分布的统计方法,它不对总体的分布形态做出任何假设,因此适用于任何类型的数据。

常见的非参数检验方法包括Wilcoxon符号秩检验、Mann-Whitney U检验、Kruskal-Wallis H检验等。

1. Wilcoxon符号秩检验Wilcoxon符号秩检验适用于比较两组配对样本数据是否存在差异。

例如,我们可以使用Wilcoxon符号秩检验来判断一种药物在服药前后对患者血压的影响。

卡方、非参数

卡方、非参数

注意事项
1、计量资料的注意事项同样适用 2、公式的适用条件n 、T 3、多组率经x2检验有显著性时,只能说明不全相同, 但不能确定哪两个不同。需要进一步证明时,用行 x列表的x2分割法。
三、非参数检验
1.参数统计和非参数统计优缺点
2.秩和检验
参数统计和非参数统计
参数:总体的统计指标称为参数( 、、) 统计量:样本的统计指标叫统计量(X、s、p) 参数统计:我们介绍的统计推断方法,通常要求样本来自正态总体, 或方差齐等,在这些假设的基础上,对总体参数进行估计和检验, 称为参数统计。 非参数统计:有许多资料不符合参数统计的要求,不能用参数统计 的方法进行检验,而需要一种不依赖于总体分布类型,也不对总 体参数进行统计推断的假设检验,称为非参数检验。
b+c<40时,校正公式: x2 =( lb-cl-1)2/ b+c
自由度:=(2-1) x (2-1)=1 第四步:确定P值 第五步:判断结果
(3)行x列表的x2检验
四格表是指只有2行2列,当行数或列数超过2时, 统称为行x列表。行x列表的x2检验是对多个样本 率(或构成比)的检验。 基本公式:x2 =(A-T)2/T 专用公式:x2 =n x ( A2 /nR x nC -1) 自由度:=(R-1)x(C-1) 适用条件:表中不宜有1/5以上格子的理论频数小 于5,或有一个格子的理论频数小于1。
(1)四格表资料的x2检验
什么是四格表资料?凡是两个率或构成比资料都 组 可以看做四格表资料。举例 别 发 病 人 数 未 发 病人数 。 观察例数 发病率(%)
实 验 组 对 照 组 合计 14 30 44 86 90 176 100 120 220 14 25 20
14 30
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

6
解:由表中数据,用Excel可求得 x =120.95, S2=40.582 ,故可作原假设 H0:X~ N (120,402) 将实轴划分为如下7个互不相交的区间。用Excel 的FREQUENCY函数计算数据落在各区间内的频 数,用NORMDIST函数求出各理论频数nPi ,统 计量的计算如表所示。
107 103 89 99 167 192 123 72 94 59 155 141 69 121 136 149 136 120 190 118 105 118 97 104 173 128 8 130 139 212 148 168 135 63 136 111 190 103 140 117 49 123 92 12 179 127 181 144 151 52 143 105 31 57 129 91 121 89 145 128 120 80 68 120 88 103 158 113 142 168 115 107 88 139 75 145 83 60 118 174 142 172 95 107 144 113 223 76 185 155 87 122 146 156 105 114 93 176 140 116
41
14
15
16
17
2.两个以上比例差异的检验
18
统计量是观测频数和期望频数差的平方除以每单 元的期望频数,并对表中的2×c个所有单元格取 和求得 2 统计量 的自由度为 (c 1)
因此在显著性水平 下,两个以上源自独立样本的比例差异假设检验的决策规 则为: 如果 (c 1) ,拒绝 H 0 : p1 p 2 ..... pc
39
40
§10.5 单因素方差分析的非参数分析:Kruskal-Wallis秩检验
如果第9章中单因素方差分析的F检验的正态 分布假设条件不符合时,可以使用Kruskal-Wallis 秩检验。Kruskal-Wallis秩检验是两独立总体 Wilcoxon秩和检验的延伸,主要用于检验项独立 总体是否有相等均值。Kruskal-Wallis秩检验和单 因素方差分析的F检验一样有效。
(- , 70 (70, 90 (90, 110 (110, 130 (130, 150 (150, 170 (170, +) 合计
8
取显著性水平 = 0.25 (由于原假设H0是我们希望 得到的结果,为使检验结论更具说服力,控制的 重点应是与原假设H0不真而接受H0的概率,故 应取的稍大些)。本例中k = 7,r = 2,k –r -1 = 4。
3
为以F(x)为分布函数的随机变量在区间 (ai, ai+1 上 取值的概率,i =1,2,…, k。则当H0为真时,由贝努 里定理,当 n 充分大时, n 次独立重复试验结果的 f n 实际频率 与其概率Pi之间的差异并不显著,于是 显然可以用统计量来刻画它们间总的差异的大小。 其中nPi为理论频数。其中nPi为理论频数。当H0为 真时,下式的值就应当较小
33
34
§10.4 两个独立总体的非参数分析:Wilcoxon秩和检验
如果样本容量很小,并且无法确定样本数据是否来 自正态分布总体,此时可以选择以下两种方法来 分析两独立总体均值间的区别: (1)用不依赖于正态总体假设的Wilcoxon秩和检验; (2)对于数据进行正态转换后使用合并方差的t检验。
7


fi 11 10 18 21 19 10 11 100
nPi 10.56 12.10 17.47 19.74 17.47 12.10 10.56 100
( f i nPi ) 2 nPi
0.0183 0.3645 0.0161 0.0804 0.1340 0.3645 0.0183 0.9961
1
非参数检验概述
在总体分布形式已知条件下未知参数检验问题。 但实际问题中总体的分布形式往往是未知的,虽 然根据中心极限定理可以有相当的把握认为大多 数经济变量服从或近似服从正态分布,但有时为 了使所做的统计推断更具说服力,就需要对总体 的分布形式进行检验。
2
2 §10.1 总体分布的 检验
检验的基本原理: (1) 设x1, x2, … , xn为总体X的一组样本观察值,F(x) 为某一已知分布的分布函数,1, 2, … , r是F(x)的r 个待定参数,分别是r个参数的点估计,以分别代替 1, 2, … ,r ,作原假设 H0:总体X的分布函数为F(x) (2) 将F(x)的定义域划分为k个互不相交的区间 (ai , ai+1,i =1,2,…, k;记fi为样本观察值x1, x2, … , xn落在 第个区间(ai ,ai+1 内的频数,并记 Pi=P{ai <X≤ ai+1}= F(ai+1)-F(ai )
2
行变量 组一 类 1(正向) 类 2(反向) 总计 组二
列变量 总计
x1 n1 x1 n1
x2 n2 x2 n2
X , ( x1 x2 )
n X n, ( n1 n2 )
10
为了检验组一样本有关类1的比例是否等于第二组样本有关 类1的比例,即假设检验为: H0 : p1 p2 原假设为两比例之间无显著差异: 备择假设为两比例之间有差异: H1 : p1 p2 2 使用卡方( )检验的基本思路为: (1) 确定统计量为
x1 x2 X p n1 n2 n
12
这样,为了计算属于类 1(即列联表中第一行)的期望频数 f e ,用 p 乘以组一 (或组二)的样本容量 n1 (或 n2 )即可得到;类似的,为了计算属于类 2(即列联 表中第二行)的期望频数 f e ,用 1 p 乘以组一(或组二)的样本容量 n1 (或 n2 )
2 2 (k r 1)
就拒绝H0,说明总体X的真实分布函数与F(x)间存在显著差 异;否则接受 H0 ,即可以认为两者在水平 下并无显著差 异。
5
某厂有一台经常需要维修的设备,该设备中有一个易损坏 的重负荷轴承,设备故障的主要原因是轴承损坏。为了制 定该设备的维修计划和维修预算,需要了解该轴承的寿命 分布。下表给出了 100 个轴承寿命的观察数据,问:该轴 承寿命是否服从正态分布?
25
26
27
28
29
§10.3 两个相关样本比例差异检验
上述几节用 检验来检验比例差异时都要求独立性条件。 然而, 有时检验比例
2
间差异的数据来自重复度量或配对取样,因此样本相关。譬如,当希望确定在一段 时期态度、比例、或行为是否发生变化时,这样的情况经常发生。
30
31
32
应用案例
i
2 ( f nP ) i 2 i nPi i 1 k
4
(3) 可以证明,当n充分大时(n≥50),若H0为真,则统计量
2 ( f nP ) i 2 i nPi i 1 k
近似服从(k -r -1)分布。其中r为分布F(x)中待定参数的个数。 于是在给定显著性水平下,若
2 2
否则,接受 H 0 。
19
此时,
x1 x2 xc X p n1 n2 nc n
20
应用案例
如果有四家酒店,根据调查数据得到的列联表如 下表所示。问在显著性水平的情况下,顾客会回 到这四家酒店的比例是否相同。
21
22
23
独立性检验
24
假设在上面例子中的酒店顾客满意度的调查中, 向表明不会再次入住酒店的顾客问第二个问题。 即不会再次入住的原因是什么,包括价格、位置、 客房服务和其他等。调查结果的列联表如下表所 示。试问在显著性水平的情况下,不会再次入住 理由与酒店之间是否有联系?
35
X (1)
秩 设 X 为一总体,将一容量为 n 的样本观察值按从小到大的次序编号排列成 X (2) X ( n ) ,称 X ( i ) 的足标 i 为 X ( i ) 的秩, i 1, 2, , n 。当其中几个数据相等
时,那么这几个数据的秩取平均值。
36
37
应用案例
38
2 2 0.9961 0.25 (4) 5.385
故在水平 = 0.25下接受原假设H0,即可认为该轴 承的使用寿命服从N (120,402)分布。
9
§10.2 比例差异的
2 检验(独立样本)
1. 两个比例差异的检验 前面,我们研究了两个比例的Z检验。这部分从不同角度 检验数据。假设检验过程使用近似卡方( )分布的检验 数据。 如果想要比较两个独立样本组的分类变量,可以做两维 的列联表,显示每组的第1类(正向类,如“成功”, “是”等)和第2类(反向类,如“失败”,“否 2 如果 (1) ,拒绝 H 0 否则,接受 H 0 。 为了计算任意单元期望频数,必须知道如果原假设为真,那么两项 比例 p1和 p2是相同的,但要计算的每组样本比例有可能不同。每 组的样本比例都可以作为参数 p1和 p2的估计值。将两个独立比例 参数估计组合起来的统计量比各自独立的比例参数估计提供更多的 信息。用 p 表示两组组合样本属于前面表中类1比例的估计值,则 1 p p 就是两组组合样本中属于类2比例的估计值。使用该表中的符号, 的定义如下式所示。
第10章 卡方检验和非参数检验
本章教学内容:
总体分布的卡方检验; 两个比例差异的卡方检验(独立样本); 两个以上比例差异的卡方检验(独立样本); 独立性的卡方检验; 两个比例差异的McNEMAR检验(相关样本); 两个独立总体的非参数检验(Wilcoxon秩和检验); 单因素方差分析的非参数检验(Kruskal-Wallis秩检验)
2 ( f f ) 2 o e fe 表格中所有元
fe 为列联表中特定 其中 fo为列联表中特定单元的观测频数, 2 单元的期望频数,因此这里的统计量 是观测频数和期望 频数差的平方除以每单元的期望频数,并对表中的所有单 元格取和求得;
相关文档
最新文档