统计学教案习题08卡方检验
卡方检验
卫生统计学卡方检验
卫生统计学卡方检验
26/94
(一) 多个样本率比较
例3 某研究者欲比较A、B、C 三种方案治疗轻、中度 高血压疗效,将年纪在50~70岁240例轻、中度高血压患 者随机等分为3组,分别采取三种方案治疗。一个疗程 后观察疗效,结果见表11.4。问三种方案治疗轻、中度 高血压有效率有没有差异?
卫生统计学卡方检验
卫生统计学卡方检验
29/94
④ 确定P值
υ=(3-1)(2-1)=2,查 2 界值表得P<0.01。
⑤ 下结论
因为P<0.01,按α=0.05水准,拒绝H0,接收 H1,差异有统计学意义。即可认为三种方案治疗轻 、
中度高血压有效率不等或不全等
卫生统计学卡方检验
30/94
例 某市重污染区、普通污染区和农村出生婴儿致畸情 况以下表,问三个地域出生婴儿致畸率有没有差异?
① 建立假设 H0:π1=π2 H1:π1≠π2
② 确定检验水准
α=0.05
③ 计算统计量 2 值
2(2 62-73 6-7 1/2 )27 12 .7 5 3 33 86 29
④ 确定P值
υ=(2-1) (2-1)=1,查 2界值表得P>0.05。
卫生统计学卡方检验
24/94
⑤ 下结论 因为P>0.05,按α=0.05水准,不拒绝H0,差 异无统计学意义。尚不能认为甲、乙两疗法对小 儿单纯性消化不良治愈率不等。
9/94
TRC
nR nC n
n R 为对应行累计
n C 为对应列累计
n 为总例数。
卫生统计学卡方检验
10/94
表1 两药治疗消化道溃疡4周后疗效
卫生统计学卡方检验
11/94
医学统计学:卡方检验
CM C N M P( x ) n CN
式中X的取值是从0与(n-N+M)之较大者开始直到n与M之较小者为止。
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 超几何分布
x n x CM CN M P( x ) n CN
C
卡方检验
■ χ2检验的基本思想
卡方检验
■ χ2检验的基本思想
卡方检验
■ χ2检验的基本思想
卡方检验
■ χ2检验的基本思想
卡方检验
■ 四格表资料的χ2检验
1.当n≥40且所有的T≥5时,用χ2检验的基本公式;当P≈α时,改用四格 表资料的Fisher确切概率法。 例 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组) 降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表1 。问两组降低颅内压的总体有效率有无差别?
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 Fisher确切概率法的基本思想
在四格表周边合计数不变的条件下, 利用超几何分布直接计算样本事件及 比样本事件更极端情形发生的概率。
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 Fisher确切概率法的基本思想
卡方检验
■ 四格表资料的χ2检验
1.当n≥40且所有的T≥5时,用χ2检验的基本公式;当P≈α时,改用四格 表资料的Fisher确切概率法。
卡方检验
■ 四格表资料的χ2检验
1.当n≥40且所有的T≥5时,用χ2检验的基本公式;当P≈α时,改用四格 表资料的Fisher确切概率法。
方差分析卡方检验练习题
方差分析与卡方检验练习题本练习题涵盖了方差分析和卡方检验的基概念、方法和应用,包含不同难度等级的题目,旨在帮助学习者巩固知识,提高分析问题和解决问题的能力。
第部分:方差分析 (ANOVA)一、单因素方差分析1. 基本概念题 (500字)简述方差分析的基本思想和假设条件。
* 解释方差分析中组间方差、组内方差和总方差的概念,以及它们之间的关系。
* 说明F检的原理以及在方差分析中的应用。
* 解释方差分析结果中的P值及其意义。
* 比较方差分析与t检验的异同点。
2. 计算题 (000字)某研究者想比较三种不同肥料对小麦产量的影响。
他随机选择了三个地块,每个地块种植了相同数量的小麦,分别施用三种不同的肥料A、B、C。
收获后,测得三个地块的小麦产量如下(单位:k/亩):肥料A:15, 18, 16, 17, 19 肥料B:20, 22, 21, 19, 23 肥料C:12, 14, 13, 5, 16请根据以上数据,进行单因素方差分析,判断三种肥料对小麦产量是否有显著性差异。
(需写出详细的计算步骤,包括自由度、平方和、均方、F值、P值等,并进行结果解释。
). 应用题 (1000字)一家公司想比较四种不同广告策略对产品销量的影响。
他们随机选择了四个地区,每个地区采用一种不同的广告策略。
三个月后,测得四个地区的销售额如下(单位:万元):策略A:10, 110, 95, 105 策略B:120, 130, 115, 125 策略C:80, 90, 75,85 策略D:150, 60, 145, 155(1)请根据以上数据,进行单因素方差分析,判断四种广告策略对产品销量是否有显著性差异。
(需写出详细的计算步骤,并进行结果解释。
)(2)如果发现有显著差异,请进行事后检验(例如Tukey检验或LSD检验),找出哪些广告策略之间存在显著性差异。
(需说明所用检验方法的原理和步骤)二、双因素方差分析 (1500字)1. 基本概念题 (50字)•解释双因素方差分析的概念和应用场景。
卡方检验例题
卡方检验例题卡方检验是统计学常用的一种方法,用来说明两个变量之间的相关性。
它是由Karl Pearson在1900年提出的,所以也叫做卡方检验(Chi-Square Test)。
以下,我们以一个实际例题为例,来介绍一下卡方检验的应用。
假设有一组数据,其中涉及两个变量:性别和哪个电视栏目是最受欢迎的。
| |News |Movie |Sports||-------|------|------|------||男性 |110 |120 |70 ||女性 |90 |60 |40 |现在,我们想知道性别和最受欢迎的电视栏目之间是否有相关性。
具体来说,我们要研究的问题是:在这个数据集中,性别和最受欢迎的电视栏目之间是否有显著的关联?接下来,我们会分步骤地进行卡方检验。
第一步:设立假设首先,我们需要根据研究问题,设立一个原假设和一个备择假设。
在这个例子中,原假设(H0)是:“性别和最受欢迎的电视栏目之间没有相关性”,备择假设(H1)是:“性别和最受欢迎的电视栏目之间有一定的相关性”。
在进行卡方检验时,我们需要基于这两个假设来进行推断。
第二步:计算期望值接下来,我们需要计算每个单元格的期望值。
期望值是指在没有性别和电视栏目之间相关性的情况下,在每个单元格中出现的预期人数。
具体计算方法可以用以下公式来表示:期望值 = (行总数× 列总数) / 总人数对于上表中的数据,期望值可以用以下公式来计算:$E_{1,1}=(110+90)×(110+120+70+60+40)/300=95.33$$E_{1,2}=(110+90)×(110+120+70+60+40)/300=110.67$$E_{1,3}=(110+90)×(110+120+70+60+40)/300=74$$E_{2,1}=(120+60)×(110+120+70+60+40)/300=104$$E_{2,2}=(120+60)×(110+120+70+60+40)/300=120$$E_{2,3}=(120+60)×(110+120+70+60+40)/300=80$其中,$E_{i,j}$表示第i行,第j列的期望值。
卡方检验
2. 如检验结果拒绝H0,只能
认为各总体率或总体构成比之间
总的来说有差别,但不能说明 它们彼此之间有差别或两两之间 有差别。
练 习
四个百分率作比较,有1个理论数小于5, 大于1,其它都大于5 。
A.只能作校正χ2检验 B.不能作校正χ2检验 C.作χ2检验不必校正 D.必须先作合理的合并
√
四格表如有一个实际数为0,
T
2
或
2
( ad bc n / 2) n
2
(a b)(c d )(a c)(b d )
例2 某医学院抽样调查大学四年级和大 学五年级的学生近视眼患病情况, 四年级学生的近视率为7.14%,五年 级学生的近视率为35.71%,见表8 -3,试问大学四年级与五年级学生 的近视率是否一样?
药物 槟榔煎剂 阿的平 合计 治疗人数 27 18 45 有效人数 22 12 34
用两种不同剂量的电离辐射照射小白鼠, 第一种剂量照射25只,在照射后14天内 死亡14只;第二种剂量照射18只,同时 期内死亡5只。问这两种剂量对小白鼠的 致死作用是否相同?
为研究两种方法细菌培养效果是否相同, 分别用两种方法对100份乳品作细菌培 养,乳胶凝聚法的阳性率是65%,常 规培养的阳性率为40%,两法一致阳 性率为25%。问两法对细菌培养的效 果有无差别?
污染 甲
乙 丙
未污染 6
30 8
23
14 3
29
44 11
79.3
31.8 27.3
合计
40
44
84
47.6
检验步骤
1、建立假设: H0:三个地区花生污染黄曲霉毒素 B1污染率相等 H1:三个地区花生污染黄曲霉毒素 B1污染率不等或不全相等 α=0.05
08卡方检验
统计比较(2检验、其它)
2×2配对资料
表7-10 两种培养基培养结果
甲培养基
+ - 合计
乙培养基
+
-
22
18
2
14
24
32
合计
40 16 56
2×2配对资料
配对2检验: 目的:两种方法的检出率比较
专用公式(b+c≥40)和校正公式( b+c< 40) :
• H0:两种方法测定的结果无相关 • H1:两种方法测定的结果相关
0.05
• 因为n=60>40,Tmin=6.90 >5,用四
格表 2 检验的专用公式: • 得卡方值为0.003,P >0.9 ,按 0.05
水准,不拒绝H0,接受H1,差异无统计 学意义,不可认为甲乙两种方法的测定 结果有相关。
14
28 50.0
24
40 40.0
行×列表资料的2检验
多个两分类样本资料的比较 多分类样本资料的比较 分类资料的相关分析 专用公式:
2 n( A2 1) nR nC
完全随机设计下两组频数分布 的2检验-2×C列联表
表7-5 某地城市和农村已婚妇女避孕方法比较
地区 节育环 避孕药 避孕套 其它 合计
配对2检验
甲法
+ - 合计
乙法
+
-
16
26
7
11
23
37
合计
42 18 60
• H0:两种方法测定的阳性率相同,即B =C
• H1:两种方法测定的阳性率不同,即B ≠C
0.05
• 对于上表数据,因为b+c = 26 + 7 = 33 <40,用配对四格表卡方检验的校正公 式:
卡方检验教案高中数学
卡方检验教案高中数学
一、教学目标:
1. 掌握卡方检验的基本原理和计算方法。
2. 理解卡方检验在统计学中的应用。
3. 能够运用卡方检验解决实际问题。
二、教学重点和难点:
1. 卡方检验的基本原理和计算方法。
2. 如何应用卡方检验解决实际问题。
三、教学内容:
1. 卡方检验的基本概念和原理。
2. 卡方检验的计算方法。
3. 卡方检验在实际问题中的应用。
四、教学过程:
1. 导入阶段:通过引入一个实际问题引起学生的兴趣和思考,如某班男女生在数学考试成绩上的差异是否存在显著性。
2. 讲解卡方检验的基本概念和原理:介绍卡方检验的定义、假设、计算公式等。
3. 案例分析:老师给出一个具体的实际问题,让学生通过计算卡方值和查表得出结论。
4. 练习和讨论:让学生自己尝试计算一些卡方检验的例题,并进行讨论和解答。
5. 总结和拓展:总结卡方检验的要点,并拓展应用。
五、教学方法:
1. 探究式学习:通过引入问题激发学生的兴趣和思考,让学生主动参与讨论和解答。
2. 合作学习:让学生分组进行练习和讨论,促进学生之间的合作和交流。
3. 提问辅导:通过提问引导学生思考,帮助学生理解和掌握知识。
4. 实践操作:让学生自己进行实际计算,加深对知识的理解。
六、教学评估:
1. 及时进行课堂小测验,检查学生对卡方检验的理解和掌握情况。
2. 考核学生通过解答实际问题应用卡方检验的能力。
以上是一份简单的卡方检验教案范本,可根据具体的教学需求和学生水平进行调整和优化。
希望对您有帮助!。
统计学方法 卡方检验
统计学方法卡方检验
卡方检验是一种统计学方法,主要用于分类变量分析,包括两个率或两个构成比的比较、多个率或多个构成比的比较以及分类资料的相关分析等。
具体步骤如下:
首先,观察实际观测值和理论推断值的偏离程度,此处的理论值可以是预期的发生频率或概率。
实际观测值与理论推断值之间的偏离程度决定了卡方值的大小。
如果卡方值越大,说明实际观测值与理论值之间的差异越大;反之,则差异越小。
如果两个值完全相等,卡方值就是0,这表明理论值完全符合实际观测值。
此外,在没有其他限定条件或说明时,卡方检验通常指的是皮尔森卡方检验。
在进行卡方检验时,研究人员通常会将观察量的值划分成若干互斥的分类,并尝试用一套理论(或零假设)去解释观察量的值落入不同分类的概率分布模型。
卡方检验的目的就在于衡量这个假设对观察结果所反映的程度。
统计学教程-卡方检验
Lower
Upper
3.000
.992
9.068
2.500
.987
.833
.684
100
6.334 1.016
❖ 结果显示,OR=3.00,说明吃了该食物者发生食物中
毒的可能性是没有吃该食物者的3.00倍?
分层卡方检验
例4 某研究人员对3家医院的卫生服务情况进行 了调查,现希望分析寻求就诊和性别之间有无 联系。(数据见cmh.sav)
Exact Sig. (1-sided)
Likelihood Ratio
14.550
1
.000
Fisher's Exact Test
.000
.000
Linear-by-Linear Associ ati on
13.910
1
.000
McNemar Test
.013c
N of Valid Cases
58
poison
Yes 10
No 30
6.4
33.6
6
54
9.6
50.4
16
84
16.0
84.0
Total 40
40.0 60
60.0 100 100.0
❖ 这就是两变量的四格表。
两分类变量间关联程度的度量
结果分析
Chi-Square Tests
Pearson Chi-Square Continuity Correction a
a. Computed onlyfor a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 5. 16.
卡方检验详述
卡方检验什么是卡方检验卡方检验是一种用途很广的计数资料的假设检验方法。
它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。
其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。
它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
卡方检验的基本原理卡方检验是以χ2分布为基础的一种常用假设检验方法,它的无效假设H0是:观察频数与期望频数没有差别。
该检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观察值与理论值之间的偏离程度。
根据χ2分布及自由度可以确定在H0假设成立的情况下获得当前统计量及更极端情况的概率P。
如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;否则就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。
卡方值的计算与意义χ2值表示观察值与理论值之问的偏离程度。
计算这种偏离程度的基本思路如下。
(1)设A代表某个类别的观察频数,E代表基于H0计算出的期望频数,A与E之差称为残差。
(2)显然,残差可以表示某一个类别观察值和理论值的偏离程度,但如果将残差简单相加以表示各类别观察频数与期望频数的差别,则有一定的不足之处。
因为残差有正有负,相加后会彼此抵消,总和仍然为0,为此可以将残差平方后求和。
(3)另一方面,残差大小是一个相对的概念,相对于期望频数为10时,期望频数为20的残差非常大,但相对于期望频数为1 000时20的残差就很小了。
考虑到这一点,人们又将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。
进行上述操作之后,就得到了常用的χ2统计量,由于它最初是由英国统计学家Karl Pearson在1900年首次提出的,因此也称之为Pearson χ2,其计算公式为:其中,Ai为i水平的观察频数,Ei为i水平的期望频数,n为总频数,pi为i水平的期望频率。
卡方检验
一、准备工作
(二)判断能否作检验,是否需要校正
1、计算理论数: ×
T=
疗法 治愈 甲药 20(17.3) 乙药 18( ) 38 合计
= 7.7
未治愈 合计 5( ) 25 12( ) 30 55 17
一、准备工作
(二)判断能否作检验,是否需要校正
1、计算理论数:
T=
疗法 甲药 乙药 合计
30×38 = 20.7 55
计算结果及判断
u | 0.316 0.20 | 0.20(1 0.20) 152 3.58
判断:u=3.58 > u0.05=1. 96(双 侧), P<0.05。 在α=0.05水准上,拒绝H0,接受H1, 差异有统计学意义。
率的U检验
2.两个样本率比较的u检验
适用条件为两样本的np和n(1-p)均 大于5。 计算公式为
∴P>0.05
4、可以认为两药疗效相同。
0 2.55 3.84
四格表卡方检验
例二:为比较槟榔煎剂和阿的平驱绦虫的效果, 对45名绦虫患者进行治疗,结果如下表,问两药 疗效是否相同?
药物 槟榔煎剂 治 疗 人 数 27 有 效 人 数 24 有效率 (%) 88.9
阿的平
18
10
55.6
一、准备工作 + (1) 24 甲 10 乙 合计 34
=4.82 甲 乙 合计
二、假设检验
1、H0:π 1=π 2 2、 H1:π 1≠π 2 α =0.05
X2=
=
(│ad-bc│-N/2)2 N
(a+b)(c+d)(a+c)(b+d)
(│24×8-10×3│-45/2)2×45 27×18×34×11
第8章卡方检验 SPSS卫生统计学
结果
五、配对设计 (二)R×R列联表
例8-6
六、四格表的确切概率法(例8-7)
总例数小于40,且有1个格子的理论频数小 于5,读取fisher‘s exact test结果p=0.214
练习
课本169-171页 练习题1、3、5、6
课外延伸内容
Kappa一致性检验
用于检验两种方法结果的一致程度。 crosstabs→statictics:选Kappa exact:选exact
其他两两比较时
设定A组与C组比较 If:组别~=2 或者:If:组别=1∣组别=3
如果想对其中的两个率进行相 互比较时,最好能够采用更加复 杂的分类数据模型,如对数线性 模型或者logistic回归模型进行分 析。 采用列联表分割等方法只能得 到近似的结果。
五、配对设计 (一)配对设计四格表(2×2列联表)
3、anylyze→descriptive statistics→crosstabs
第一个表显示数据处理概况:有效数据 例数、无效数据例数、总例数
第二个表显示列联表的资料,一个期望频数小于5(4.8)
结论:有1个格子的期望频数大于1,小于5,最小 期望频数为4.80 连续校正卡方值(continuity correction) x2=2.624, p=0.105>0.05,差别没有统计学意义。
Kappa检验会利用列联表中的全部信息,而 McNemar检验只关心两者不一致的情况。 对于一致性较好,即绝大多数数据都在主对 角线上的大样本列联表, McNemar检验 可能会失去使用价值。 如对1万个案例进行一致性评价,9995个都 是完全一致的,显然,一致性相当的好, 但McNemar检验只考虑不一致的数据, 反而可能得出有差异的结论。
卡方检验例题
卡方检验例题卡方检验是一种用来检验观察值与理论值之间差异的方法,是一种常用的非参数假设检验方法。
在本篇文档中,我们将为大家介绍卡方检验的基本概念以及一个具体的例题解析。
基本概念在了解卡方检验之前,我们需要先了解一下以下几个基本概念:•观察值:指实际调查或实验中得到的某一类别的数量。
•理论值:指在该种情况下,如果服从某种假设分布所得到的某一类别的数量。
•卡方值:衡量观察值和理论值之间差异的统计量,计算方式为将观察值与理论值的差异平方后除以理论值,然后将所有类别的结果相加得到。
•自由度:指随机变量可以自由取得的值的数目减1。
卡方检验的原假设为两组数据之间没有差异,备择假设为两组数据之间有差异。
例题解析现在我们来看一个具体的例题:在一个蓝球和红球各10个的盒子里,随机抽出了10个球,结果出现了7个蓝球和3个红球。
问你,能否认为这个盒子里的蓝球和红球数量相等?解析:根据题意,我们可以得出观察值为7和3,理论值应该是5和5,如果两组数据之间没有差异,那么我们可以使用卡方检验来检验。
首先,我们需要列出以下的交叉列表格:颜色实际数量预期数量实际数量-预期数量差异平方差异平方/预期数量蓝色7 5 2 4 0.8红色 3 5 -2 4 0.8总计10 10 8 1.6然后,我们可以根据卡方检验公式来计算卡方值:$X^2=\\sum_{i=1}^{n} \\frac{(O_i-E_i)^2}{E_i}$其中,O i为观察值,E i为理论值,n为类别总数。
代入数据后计算得:$X^2=\\frac{(7-5)^2}{5}+\\frac{(3-5)^2}{5}=1.6$接下来,我们需要确定自由度。
自由度的计算公式为:自由度=类别总数-1。
在本例中,我们有2个类别,因此自由度为1。
最后,我们需要根据自由度和显著性水平(通常为0.05或0.01)查找卡方分布表来确定临界值。
在自由度为1,显著性水平为0.05时,临界值为3.84;在显著性水平为0.01时,临界值为6.63。
统计学教案习题08卡方检验
第八章 2χ检验一、教学大纲要求(一) 掌握内容 1. 2χ检验的用途。
2. 四格表的2χ检验。
(1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。
3. 行⨯列表的2χ检验。
(二) 熟悉内容频数分布拟合优度的2χ检验。
(三) 了解内容 1.2χ分布的图形。
2.四格表的确切概率法。
二、教学内容精要(一)2χ检验的用途2χ检验(Chi-square test )用途较广,主要用途如下:1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二)2χ检验的基本思想1.2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。
在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2χ值不应该很大,若实际计算出的2χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。
2. 基本公式:()∑-=TT A 22χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。
四格表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2χ值是一致的。
(三)率的抽样误差与可信区间 1.率的抽样误差与标准误样本率与总体率之间存在抽样误差,其度量方法: np )1(ππσ-=,π为总体率,或 (8-1)np p S p )1(-=, p 为样本率; (8-2) 2.总体率的可信区间当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。
总体率的可信区间:(p p S u p S u p ⨯+⨯-2/2/,αα)。
(8-3) (四)2χ检验的基本计算表8-12检验的用途、假设的设立及基本计算公式01四格表①独立资料两样本率的比较②配对资料两 样本率的比较0H :两总体率相等 1H :两总体率不等①专用公式)(22nbc ad -=χ 1②当n ≥40但1≤T<5时,校正公式))()()(()2/(22d b c a d c b a n n bc ad ++++--=χ③配对设计cb c b +--=22)1(χR ⨯C 表①多个样本率、 构成比的比较②两个变量之 间关联性分析0H :多个总体率(构成比)相等(0H :两种属性间存在关联)1H :多个总体率(构成比)不全相等(0H :两种属性间存在关联))1(22-=∑CR n n A n χ (R-1)(C-1)频数分布表 频数分布的拟合优度检验0H :资料服从某已知的理论分布 1H :资料不服从某已知的理论分布∑-TT A 2)( 据频数表的组数而定(五)四格表的确切概率法:当四格表有理论数小于1或n <40时,宜用四格表的确切概率法。
统计学教案习题08卡方检验
第八章2χ检验一、教学大纲要求(一) 掌握内容 1. 2χ检验的用途。
2. 四格表的2χ检验。
(1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。
3. 行⨯列表的2χ检验。
(二) 熟悉内容频数分布拟合优度的2χ检验。
(三) 了解内容 1.2χ分布的图形。
2.四格表的确切概率法。
二、教学内容精要(一) 2χ检验的用途2χ检验(Chi-square test )用途较广,主要用途如下:1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想1.2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。
在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2χ值不应该很大,若实际计算出的2χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。
2. 基本公式:()∑-=TT A 22χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。
四格表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2χ值是一致的。
(三)率的抽样误差与可信区间 1.率的抽样误差与标准误样本率与总体率之间存在抽样误差,其度量方法: np )1(ππσ-=,π为总体率,或 (8-1)np p S p )1(-=, p 为样本率; (8-2)2.总体率的可信区间当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。
总体率的可信区间:(p p S u p S u p ⨯+⨯-2/2/,αα)。
(8-3) (四)2χ检验的基本计算表8-1 2检验的用途、假设的设立及基本计算公式01四格表①独立资料两样本率的比较②配对资料两 样本率的比较0H :两总体率相等 1H :两总体率不等①专用公式))()()(()(22d b c a d c b a nbc ad ++++-=χ②当n ≥40但1≤T<5时,校正公式1③配对设计cb c b +--=22)1(χR ⨯C 表①多个样本率、 构成比的比较②两个变量之 间关联性分析0H :多个总体率(构成比)相等(0H :两种属性间存在关联)1H :多个总体率(构成比)不全相等(0H :两种属性间存在关联))1(22-=∑CR n n A n χ(R-1)(C-1)频数分布表 频数分布的拟合优度检验0H :资料服从某已知的理论分布 1H :资料不服从某已知的理论分布∑-TT A 2)(据频数表的组数而定(五)四格表的确切概率法:当四格表有理论数小于1或n <40时,宜用四格表的确切概率法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章2χ检验一、教学大纲要求(一) 掌握内容 1. 2χ检验的用途。
2. 四格表的2χ检验。
(1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。
3. 行⨯列表的2χ检验。
(二) 熟悉内容频数分布拟合优度的2χ检验。
(三) 了解内容 1.2χ分布的图形。
2.四格表的确切概率法。
二、教学内容精要(一) 2χ检验的用途2χ检验(Chi-square test )用途较广,主要用途如下:1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想1.2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。
在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2χ值不应该很大,若实际计算出的2χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。
2. 基本公式:()∑-=TT A 22χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。
四格表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2χ值是一致的。
(三)率的抽样误差与可信区间 1.率的抽样误差与标准误样本率与总体率之间存在抽样误差,其度量方法: np )1(ππσ-=,π为总体率,或 (8-1)np p S p )1(-=, p 为样本率; (8-2)2.总体率的可信区间当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。
总体率的可信区间:(p p S u p S u p ⨯+⨯-2/2/,αα)。
(8-3) (四)2χ检验的基本计算表8-1 2检验的用途、假设的设立及基本计算公式01四格表①独立资料两样本率的比较②配对资料两 样本率的比较0H :两总体率相等 1H :两总体率不等①专用公式))()()(()(22d b c a d c b a nbc ad ++++-=χ②当n ≥40但1≤T<5时,校正公式1③配对设计cb c b +--=22)1(χR ⨯C 表①多个样本率、 构成比的比较②两个变量之 间关联性分析0H :多个总体率(构成比)相等(0H :两种属性间存在关联)1H :多个总体率(构成比)不全相等(0H :两种属性间存在关联))1(22-=∑CR n n A n χ(R-1)(C-1)频数分布表 频数分布的拟合优度检验0H :资料服从某已知的理论分布 1H :资料不服从某已知的理论分布∑-TT A 2)(据频数表的组数而定(五)四格表的确切概率法:当四格表有理论数小于1或n <40时,宜用四格表的确切概率法。
(六)2χ检验的应用条件及注意事项1.分析四格表资料时,应注意连续性校正的问题,当1<T <5,n >40时,用连续性校正2χ检验;T ≤1,或n ≤40时,用Fisher 精确概率法。
2.对于R ⨯C 表资料应注意以下两点:(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5;(2)注意考察是否有有序变量存在。
对于单向有序R ⨯C 表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R ⨯C 表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R ⨯C 表资料,为考察两种方法检测的一致性,应选用Kappa 检验。
三、典型试题分析(一)单项选择题1.下列哪项检验不适用2χ检验( )A . 两样本均数的比较B . 两样本率的比较C . 多个样本构成比的比较D . 拟合优度检验答案:A [评析] 本题考点:2χ检验的主要用途。
2χ检验不能用于均数差别的比较。
2.分析四格表时,通常在什么情况下需用Fisher 精确概率法( )A .1<T <5,n>40B .T <5C .T 1≤或n 40≤D .T 1≤或n 100≤答案: C [评析] 本题考点:对于四格表,当T 1≤或n 40≤时,不宜用2χ检验,应用Fisher 精确概率法。
3.2χ值的取值范围为A .∞-<2χ<∞+ B .+∞≤≤20χ C .12≤χ D .02≤≤∞-χ答案: B [评析]根据2χ分布的图形或2χ的基本公式可以判断2χ值一定是大于等于零且没有上界的,故应选B 。
(二)是非题两样本率的比较可以采用2χ检验,也可以采用双侧u 检验。
答案:正确。
[评析]就两个样本率的比较而言,双侧u 检验与2χ检验是等价的。
(三)简答题1.四格表的2χ检验和u 检验有何联系与区别?答案:相同点:凡是能用u 检验进行的两个率比较检验的资料,都可用2χ检验,两者是等价的,即22χ=u ;相异点:(1)u 检验可进行单侧检验;(2)满足四格表u 检验的资料,计算两个率之差的可信区间,可从专业上判断两率之差有无实际意义;(3)2χ检验可用于2⨯2列联表资料有无关联的检验。
2.R ⨯C 表2χ检验的适用条件及当条件不满足时可以考虑的处理方法是什么?答案:R ⨯C 表2χ检验的适用条件是理论频数不宜过小,否则有可能产生偏性。
当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。
但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。
(四)计算题1.为研究静脉曲张是否与肥胖有关,观察122对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。
表8-2 122对同胞兄弟静脉曲张发生情况正常体重 肥胖合计 发生 未发生 发 生19 5 24 未发生 12 86 98 合 计31 91122[评析]这是一个配对设计的资料,因此用配对2χ检验公式计算。
H 0:肥胖者与正常体重者的静脉曲张发生情况无差别 H 1:肥胖者与正常体重者的静脉曲张发生情况不同 05.0=α cb c b +--=22)1(χ=()12.212511252=+--,1=ν2χ=2.11<21,05.0χ,P >0.05,尚不能认为静脉曲张与肥胖有关。
2.某卫生防疫站在中小学观察三种矫正近视眼措施的效果,近期疗效数据见表8-3。
对三种措施的疗效作出评价。
夏天无眼药水 51 84 135 37.78 新医疗法 6 26 32 18.75 眼保健操 5 13 18 27.78 合计 62 123 18533.51[评析]0H :三种措施有效率相等1H :三种措施有效率不相等或不全相等 05.0=α)1(22-=∑c r n n A n χ=185⨯⎪⎪⎭⎫ ⎝⎛-⨯+⨯+⨯+⨯+⨯+⨯1181231318625321232632626135123841356251222222=4.498,ν=(2-1)(3-1)=2 查表得0.25>P >0.10,按0.05α=水准不拒绝0H ,尚不能认为三种措施有效率有差别。
3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见表8-4,问4种镇痛方法的效果有无差异?表8-4 4种镇痛方法的效果比较 镇痛方法 例数 有效率(%)颈麻100 41 注药100 94 置栓100 89 对照100 27 [评析] 为了应用2χ检验,首先应计算出有效和无效的实际频数,列出计算表,见表8-5。
表8-5 4种镇痛方法的效果比较镇痛方法 有效例数 无效例数 合计颈麻41 59 100 注药94 6 100 置栓89 11 100 对照27 73 100 合计251 149 4000H :4种镇痛方法的效果相同 1H :4种镇痛方法的效果不全相同05.0=α)1(22-=∑c r n n A n χ=400⎪⎪⎭⎫ ⎝⎛-⨯++⨯+⨯⨯110014973...1001495910025141222=146.175, ν=(4-1)(2-1)=3查表得P <0.05,按0.05α=水准拒绝0H ,接受1H ,即4种镇痛方法的效果不全相同。
四、习 题(一) 单项选择题1. 关于样本率p 的分布正确的说法是: A . 服从正态分布 B . 服从2χ分布C . 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布D . 服从t 分布 2. 以下说法正确的是: A . 两样本率比较可用u 检验 B . 两样本率比较可用t 检验 C . 两样本率比较时,有2χ=u D . 两样本率比较时,有22χ=t 3. 率的标准误的计算公式是: A .)1(p p - B .n p p )1(- C.1-n p D.np p )1(- 4. 以下关于2χ检验的自由度的说法,正确的是: A .拟合优度检验时,2-=n ν(n 为观察频数的个数) B .对一个43⨯表进行检验时,11=ν C .对四格表检验时,ν=4D .若2,05.02,05.0ηνχχ>,则ην>5. 用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?A .不能确定B .甲、乙法一样C .甲法优于乙法D .乙法优于甲法6.已知男性的钩虫感染率高于女性。
今欲比较甲乙两乡居民的钩虫感染率,适当的方法是: A .分性别比较 B .两个率比较的2χ检验 C .不具可比性,不能比较 D .对性别进行标准化后再做比较 7.以下说法正确的是A .两个样本率的比较可用u 检验也可用2χ检验B .两个样本均数的比较可用u 检验也可用2χ检验C .对于多个率或构成比的比较,u 检验可以替代2χ检验D .对于两个样本率的比较,2χ检验比u 检验可靠 (二) 名词解释1. 实际频数与理论频数 2. 2χ界值表 3. 拟合优度 4. 配对四格表5. 双向有序分类资料 6. 率的标准误7. 多个率的两两比较 8. Fisher 精确概率 9. McNemar 检验 10. Yates 校正(三) 是非题四个样本率做比较,2)3(05.02χχ> ,可认为各总体率均不相等。
(四) 计算题1.121名前列腺癌患者中,82名接受电切术治疗,术后有合并症者11人;39名接受开放手术治疗,术后有合并症1人。