统计学教案习题08卡方检验

合集下载

卡方检验

卡方检验是一种常用的假设检验方法，以卡方分布为基础，主要用于分析分类变量。其基本无效假设是行分类变量与列分类变量无关联。在检验过程中，首先建立检验假设并确定检验水准，通常设为α=0.05。接着，计算检验统计量χ2值，这是通过比较实际观察数与在无效假设为真情况下的理论数（期望值）之差来实现的。具结果求和，得到χ2值。然后，根据χ2值和自由度，在卡方分布表中查找对应的P值。最后，根据P值与检验水准α的比较，作出推断结论。如果P值小于或等于α，则拒绝无效假设，认为行分类变量与列分类变量有关联；反之，则不拒绝无效假设，尚不能认为两者有关联。

卫生统计学卡方检验

卫生统计学卡方检验
26/94
(一) 多个样本率比较
例3 某研究者欲比较A、B、C 三种方案治疗轻、中度高血压疗效，将年纪在50~70岁240例轻、中度高血压患者随机等分为3组，分别采取三种方案治疗。一个疗程后观察疗效，结果见表11.4。问三种方案治疗轻、中度高血压有效率有没有差异？
卫生统计学卡方检验
卫生统计学卡方检验
29/94
④ 确定P值
υ＝(3－1)(2－1)＝2，查 2 界值表得P<0.01。
⑤ 下结论
因为P<0.01，按α=0.05水准，拒绝H0，接收 H1，差异有统计学意义。即可认为三种方案治疗轻、
中度高血压有效率不等或不全等
卫生统计学卡方检验
30/94
例某市重污染区、普通污染区和农村出生婴儿致畸情况以下表，问三个地域出生婴儿致畸率有没有差异？
① 建立假设 H0：π1=π2 H1：π1≠π2
② 确定检验水准
α=0.05
③ 计算统计量 2 值
2(2 62-73 6-7 1/2 )27 12 .7 5 3 33 86 29
④ 确定P值
υ＝(2－1) (2－1)＝1，查 2界值表得P>0.05。
卫生统计学卡方检验
24/94
⑤ 下结论因为P>0.05，按α=0.05水准，不拒绝H0，差异无统计学意义。尚不能认为甲、乙两疗法对小儿单纯性消化不良治愈率不等。
9/94
TRC
nR nC n
n R 为对应行累计
n C 为对应列累计
n 为总例数。
卫生统计学卡方检验
10/94
表1 两药治疗消化道溃疡4周后疗效
卫生统计学卡方检验
11/94

医学统计学：卡方检验

CM C N M P( x ) n CN
式中X的取值是从0与（n-N+M）之较大者开始直到n与M之较小者为止。
卡方检验
■ 四格表资料的χ2检验
3.当n<40，或T<1时，用四格表资料的Fisher确切概率法。超几何分布
x n x CM CN M P( x ) n CN
C
卡方检验
■ χ2检验的基本思想
卡方检验
■ χ2检验的基本思想
卡方检验
■ χ2检验的基本思想
卡方检验
■ χ2检验的基本思想
卡方检验
■ 四格表资料的χ2检验
1.当n≥40且所有的T≥5时，用χ2检验的基本公式；当P≈α时，改用四格表资料的Fisher确切概率法。例某院欲比较异梨醇口服液（试验组）和氢氯噻嗪+地塞米松（对照组）降低颅内压的疗效。将200例颅内压增高症患者随机分为两组，结果见表1 。问两组降低颅内压的总体有效率有无差别？
卡方检验
■ 四格表资料的χ2检验
3.当n<40，或T<1时，用四格表资料的Fisher确切概率法。 Fisher确切概率法的基本思想
在四格表周边合计数不变的条件下，利用超几何分布直接计算样本事件及比样本事件更极端情形发生的概率。
卡方检验
■ 四格表资料的χ2检验
3.当n<40，或T<1时，用四格表资料的Fisher确切概率法。 Fisher确切概率法的基本思想
卡方检验
■ 四格表资料的χ2检验
1.当n≥40且所有的T≥5时，用χ2检验的基本公式；当P≈α时，改用四格表资料的Fisher确切概率法。
卡方检验
■ 四格表资料的χ2检验
1.当n≥40且所有的T≥5时，用χ2检验的基本公式；当P≈α时，改用四格表资料的Fisher确切概率法。

方差分析卡方检验练习题

方差分析与卡方检验练习题本练习题涵盖了方差分析和卡方检验的基概念、方法和应用，包含不同难度等级的题目，旨在帮助学习者巩固知识，提高分析问题和解决问题的能力。

第部分：方差分析 (ANOVA)一、单因素方差分析1. 基本概念题 (500字)简述方差分析的基本思想和假设条件。

* 解释方差分析中组间方差、组内方差和总方差的概念，以及它们之间的关系。

* 说明F检的原理以及在方差分析中的应用。

* 解释方差分析结果中的P值及其意义。

* 比较方差分析与t检验的异同点。

2. 计算题 (000字)某研究者想比较三种不同肥料对小麦产量的影响。

他随机选择了三个地块，每个地块种植了相同数量的小麦，分别施用三种不同的肥料A、B、C。

收获后，测得三个地块的小麦产量如下（单位：k/亩）：肥料A：15, 18, 16, 17, 19 肥料B：20, 22, 21, 19, 23 肥料C：12, 14, 13, 5, 16请根据以上数据，进行单因素方差分析，判断三种肥料对小麦产量是否有显著性差异。

(需写出详细的计算步骤，包括自由度、平方和、均方、F值、P值等，并进行结果解释。

). 应用题 (1000字)一家公司想比较四种不同广告策略对产品销量的影响。

他们随机选择了四个地区，每个地区采用一种不同的广告策略。

三个月后，测得四个地区的销售额如下（单位：万元）：策略A：10, 110, 95, 105 策略B：120, 130, 115, 125 策略C：80, 90, 75,85 策略D：150, 60, 145, 155(1)请根据以上数据，进行单因素方差分析，判断四种广告策略对产品销量是否有显著性差异。

(需写出详细的计算步骤，并进行结果解释。

)(2)如果发现有显著差异，请进行事后检验（例如Tukey检验或LSD检验），找出哪些广告策略之间存在显著性差异。

(需说明所用检验方法的原理和步骤)二、双因素方差分析 (1500字)1. 基本概念题 (50字)•解释双因素方差分析的概念和应用场景。

卡方检验例题

卡方检验例题卡方检验是统计学常用的一种方法，用来说明两个变量之间的相关性。

它是由Karl Pearson在1900年提出的，所以也叫做卡方检验（Chi-Square Test）。

以下，我们以一个实际例题为例，来介绍一下卡方检验的应用。

假设有一组数据，其中涉及两个变量：性别和哪个电视栏目是最受欢迎的。

| |News |Movie |Sports||-------|------|------|------||男性 |110 |120 |70 ||女性 |90 |60 |40 |现在，我们想知道性别和最受欢迎的电视栏目之间是否有相关性。

具体来说，我们要研究的问题是：在这个数据集中，性别和最受欢迎的电视栏目之间是否有显著的关联？接下来，我们会分步骤地进行卡方检验。

第一步：设立假设首先，我们需要根据研究问题，设立一个原假设和一个备择假设。

在这个例子中，原假设（H0）是：“性别和最受欢迎的电视栏目之间没有相关性”，备择假设（H1）是：“性别和最受欢迎的电视栏目之间有一定的相关性”。

在进行卡方检验时，我们需要基于这两个假设来进行推断。

第二步：计算期望值接下来，我们需要计算每个单元格的期望值。

期望值是指在没有性别和电视栏目之间相关性的情况下，在每个单元格中出现的预期人数。

具体计算方法可以用以下公式来表示：期望值 = (行总数× 列总数) / 总人数对于上表中的数据，期望值可以用以下公式来计算：$E_{1,1}=(110+90)×(110+120+70+60+40)/300=95.33$$E_{1,2}=(110+90)×(110+120+70+60+40)/300=110.67$$E_{1,3}=(110+90)×(110+120+70+60+40)/300=74$$E_{2,1}=(120+60)×(110+120+70+60+40)/300=104$$E_{2,2}=(120+60)×(110+120+70+60+40)/300=120$$E_{2,3}=(120+60)×(110+120+70+60+40)/300=80$其中，$E_{i,j}$表示第i行，第j列的期望值。

卡方检验

2. 如检验结果拒绝H0，只能
认为各总体率或总体构成比之间
总的来说有差别，但不能说明它们彼此之间有差别或两两之间有差别。
练习
四个百分率作比较，有1个理论数小于5，大于1，其它都大于5 。
A.只能作校正χ2检验 B.不能作校正χ2检验 C.作χ2检验不必校正 D.必须先作合理的合并
√
四格表如有一个实际数为0，
T
2
或

2
( ad bc n / 2) n
2
(a b)(c d )(a c)(b d )
例2 某医学院抽样调查大学四年级和大学五年级的学生近视眼患病情况，四年级学生的近视率为7.14％，五年级学生的近视率为35.71％，见表8 －3，试问大学四年级与五年级学生的近视率是否一样？
药物槟榔煎剂阿的平合计治疗人数 27 18 45 有效人数 22 12 34
用两种不同剂量的电离辐射照射小白鼠，第一种剂量照射25只，在照射后14天内死亡14只；第二种剂量照射18只，同时期内死亡5只。问这两种剂量对小白鼠的致死作用是否相同？
为研究两种方法细菌培养效果是否相同，分别用两种方法对100份乳品作细菌培养，乳胶凝聚法的阳性率是65%，常规培养的阳性率为40%，两法一致阳性率为25%。问两法对细菌培养的效果有无差别？
污染甲
乙丙
未污染 6
30 8
23
14 3
29
44 11
79.3
31.8 27.3
合计
40
44
84
47.6
检验步骤
1、建立假设： H0:三个地区花生污染黄曲霉毒素 B1污染率相等 H1:三个地区花生污染黄曲霉毒素 B1污染率不等或不全相等 α=0.05

08卡方检验

R×R配对资料分析：相关分析（2检验）
统计比较（2检验、其它）
2×2配对资料
表7-10 两种培养基培养结果
甲培养基
＋－合计
乙培养基
＋
－
22
18
2
14
24
32
合计
40 16 56
2×2配对资料
配对2检验：目的：两种方法的检出率比较
专用公式（b＋c≥40）和校正公式（ b＋c＜ 40）：
• H0：两种方法测定的结果无相关 • H1：两种方法测定的结果相关
0.05
• 因为n＝60＞40，Tmin=6.90 ＞5，用四
格表 2 检验的专用公式： • 得卡方值为0.003，P ＞0.9 ，按 0.05
水准，不拒绝H0，接受H1，差异无统计学意义，不可认为甲乙两种方法的测定结果有相关。
14
28 50.0
24
40 40.0
行×列表资料的2检验
多个两分类样本资料的比较多分类样本资料的比较分类资料的相关分析专用公式：
2 n( A2 1) nR nC
完全随机设计下两组频数分布的2检验－2×C列联表
表7-5 某地城市和农村已婚妇女避孕方法比较
地区节育环避孕药避孕套其它合计
配对2检验
甲法
＋－合计
乙法
＋
－
16
26
7
11
23
37
合计
42 18 60
• H0：两种方法测定的阳性率相同，即B =C
• H1：两种方法测定的阳性率不同，即B ≠C
0.05
• 对于上表数据，因为b＋c = 26 + 7 = 33 ＜40，用配对四格表卡方检验的校正公式：

卡方检验教案高中数学

卡方检验教案高中数学
一、教学目标：
1. 掌握卡方检验的基本原理和计算方法。

2. 理解卡方检验在统计学中的应用。

3. 能够运用卡方检验解决实际问题。

二、教学重点和难点：
1. 卡方检验的基本原理和计算方法。

2. 如何应用卡方检验解决实际问题。

三、教学内容：
1. 卡方检验的基本概念和原理。

2. 卡方检验的计算方法。

3. 卡方检验在实际问题中的应用。

四、教学过程：
1. 导入阶段：通过引入一个实际问题引起学生的兴趣和思考，如某班男女生在数学考试成绩上的差异是否存在显著性。

2. 讲解卡方检验的基本概念和原理：介绍卡方检验的定义、假设、计算公式等。

3. 案例分析：老师给出一个具体的实际问题，让学生通过计算卡方值和查表得出结论。

4. 练习和讨论：让学生自己尝试计算一些卡方检验的例题，并进行讨论和解答。

5. 总结和拓展：总结卡方检验的要点，并拓展应用。

五、教学方法：
1. 探究式学习：通过引入问题激发学生的兴趣和思考，让学生主动参与讨论和解答。

2. 合作学习：让学生分组进行练习和讨论，促进学生之间的合作和交流。

3. 提问辅导：通过提问引导学生思考，帮助学生理解和掌握知识。

4. 实践操作：让学生自己进行实际计算，加深对知识的理解。

六、教学评估：
1. 及时进行课堂小测验，检查学生对卡方检验的理解和掌握情况。

2. 考核学生通过解答实际问题应用卡方检验的能力。

以上是一份简单的卡方检验教案范本，可根据具体的教学需求和学生水平进行调整和优化。

希望对您有帮助！。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第八章2χ检验一、教学大纲要求（一）掌握内容 1. 2χ检验的用途。

2. 四格表的2χ检验。

（1）四格表2χ检验公式的应用条件；（2）不满足应用条件时的解决办法；（3）配对四格表的2χ检验。

3. 行⨯列表的2χ检验。

（二）熟悉内容频数分布拟合优度的2χ检验。

（三）了解内容 1．2χ分布的图形。

2．四格表的确切概率法。

二、教学内容精要(一) 2χ检验的用途2χ检验（Chi-square test ）用途较广，主要用途如下：1．推断两个率及多个总体率或总体构成比之间有无差别 2．两种属性或两个变量之间有无关联性 3．频数分布的拟合优度检验 (二) 2χ检验的基本思想1．2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。

在零假设0H （比如0H ：21ππ=）成立的条件下，实际频数与理论频数相差不应该很大，即2χ值不应该很大，若实际计算出的2χ值较大，超过了设定的检验水准所对应的界值，则有理由怀疑0H 的真实性，从而拒绝0H ，接受H 1（比如1H ：21ππ≠）。

2．基本公式：()∑-=TT A 22χ，A 为实际频数（Actual Frequency ）,T 为理论频数（Theoretical Frequency ）。

四格表2χ检验的专用公式正是由此公式推导出来的，用专用公式与用基本公式计算出的2χ值是一致的。

(三)率的抽样误差与可信区间 1．率的抽样误差与标准误样本率与总体率之间存在抽样误差，其度量方法： np )1(ππσ-=，π为总体率，或 (8-1)np p S p )1(-=， p 为样本率； (8-2)2．总体率的可信区间当n 足够大，且p 和1-p 均不太小，p 的抽样分布逼近正态分布。

总体率的可信区间：（p p S u p S u p ⨯+⨯-2/2/,αα）。

(8-3) (四)2χ检验的基本计算表8-1 2检验的用途、假设的设立及基本计算公式01四格表①独立资料两样本率的比较②配对资料两样本率的比较0H ：两总体率相等 1H ：两总体率不等①专用公式))()()(()(22d b c a d c b a nbc ad ++++-=χ②当n ≥40但1≤T<5时，校正公式1③配对设计cb c b +--=22)1(χR ⨯C 表①多个样本率、构成比的比较②两个变量之间关联性分析0H ：多个总体率（构成比）相等(0H ：两种属性间存在关联)1H ：多个总体率（构成比）不全相等(0H ：两种属性间存在关联))1(22-=∑CR n n A n χ(R-1)(C-1)频数分布表频数分布的拟合优度检验0H ：资料服从某已知的理论分布 1H ：资料不服从某已知的理论分布∑-TT A 2)(据频数表的组数而定（五）四格表的确切概率法:当四格表有理论数小于1或n <40时，宜用四格表的确切概率法。

（六）2χ检验的应用条件及注意事项1．分析四格表资料时，应注意连续性校正的问题，当1<T <5，n >40时，用连续性校正2χ检验；T ≤1，或n ≤40时，用Fisher 精确概率法。

2．对于R ⨯C 表资料应注意以下两点：（1）理论频数不宜太小，一般要求：理论频数<5的格子数不应超过全部格子的1/5；（2）注意考察是否有有序变量存在。

对于单向有序R ⨯C 表资料，当指标分组变量是有序的时，宜用秩和检验；对于双向有序且属性不同的R ⨯C 表资料，若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势，应选用定性资料的相关分析或线性趋势检验；对于双向有序且属性相同的R ⨯C 表资料，为考察两种方法检测的一致性，应选用Kappa 检验。

三、典型试题分析（一）单项选择题1．下列哪项检验不适用2χ检验（）A ．两样本均数的比较B ．两样本率的比较C ．多个样本构成比的比较D ．拟合优度检验答案：A [评析] 本题考点：2χ检验的主要用途。

2χ检验不能用于均数差别的比较。

2．分析四格表时，通常在什么情况下需用Fisher 精确概率法（）A ．1<T <5,n>40B ．T <5C ．T 1≤或n 40≤D ．T 1≤或n 100≤答案： C [评析] 本题考点：对于四格表，当T 1≤或n 40≤时，不宜用2χ检验，应用Fisher 精确概率法。

3．2χ值的取值范围为A ．∞-<2χ<∞+ B ．+∞≤≤20χ C ．12≤χ D ．02≤≤∞-χ答案： B [评析]根据2χ分布的图形或2χ的基本公式可以判断2χ值一定是大于等于零且没有上界的，故应选B 。

（二）是非题两样本率的比较可以采用2χ检验，也可以采用双侧u 检验。

答案：正确。

[评析]就两个样本率的比较而言，双侧u 检验与2χ检验是等价的。

（三）简答题1．四格表的2χ检验和u 检验有何联系与区别？答案：相同点：凡是能用u 检验进行的两个率比较检验的资料，都可用2χ检验，两者是等价的，即22χ=u ；相异点：（1）u 检验可进行单侧检验；（2）满足四格表u 检验的资料，计算两个率之差的可信区间，可从专业上判断两率之差有无实际意义；（3）2χ检验可用于2⨯2列联表资料有无关联的检验。

2．R ⨯C 表2χ检验的适用条件及当条件不满足时可以考虑的处理方法是什么？答案：R ⨯C 表2χ检验的适用条件是理论频数不宜过小，否则有可能产生偏性。

当条件不满足时有三种处理方法：①增大样本例数使理论频数变大；②删去理论数太小的行或列；③将理论数太小的行或列与性质相近的邻行或邻列合并，使重新计算的理论频数变大。

但②、③法都可能会损失信息或损害样本的随机性，因此应慎用。

（四）计算题1．为研究静脉曲张是否与肥胖有关，观察122对同胞兄弟，每对同胞兄弟中有一个属肥胖，另一个属正常体重，记录得静脉曲张发生情况见表8-2，试分析之。

表8-2 122对同胞兄弟静脉曲张发生情况正常体重肥胖合计发生未发生发生19 5 24 未发生 12 86 98 合计31 91122[评析]这是一个配对设计的资料，因此用配对2χ检验公式计算。

H 0：肥胖者与正常体重者的静脉曲张发生情况无差别 H 1：肥胖者与正常体重者的静脉曲张发生情况不同 05.0=α cb c b +--=22)1(χ=()12.212511252=+--，1=ν2χ=2.11<21,05.0χ，P >0.05,尚不能认为静脉曲张与肥胖有关。

2．某卫生防疫站在中小学观察三种矫正近视眼措施的效果，近期疗效数据见表8-3。

对三种措施的疗效作出评价。

夏天无眼药水 51 84 135 37.78 新医疗法 6 26 32 18.75 眼保健操 5 13 18 27.78 合计 62 123 18533.51[评析]0H ：三种措施有效率相等1H ：三种措施有效率不相等或不全相等 05.0=α)1(22-=∑c r n n A n χ=185⨯⎪⎪⎭⎫ ⎝⎛-⨯+⨯+⨯+⨯+⨯+⨯1181231318625321232632626135123841356251222222=4.498，ν=（2-1）（3-1）=2 查表得0.25>P >0.10，按0.05α=水准不拒绝0H ，尚不能认为三种措施有效率有差别。

3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象，将其分为4组，每组100例，分别给予不同的镇痛处理，观察的镇痛效果见表8-4，问4种镇痛方法的效果有无差异？表8-4 4种镇痛方法的效果比较镇痛方法例数有效率（%）颈麻100 41 注药100 94 置栓100 89 对照100 27 [评析] 为了应用2χ检验，首先应计算出有效和无效的实际频数，列出计算表，见表8-5。

表8-5 4种镇痛方法的效果比较镇痛方法有效例数无效例数合计颈麻41 59 100 注药94 6 100 置栓89 11 100 对照27 73 100 合计251 149 4000H ：4种镇痛方法的效果相同 1H ：4种镇痛方法的效果不全相同05.0=α)1(22-=∑c r n n A n χ=400⎪⎪⎭⎫ ⎝⎛-⨯++⨯+⨯⨯110014973...1001495910025141222=146.175， ν=（4-1）（2-1）=3查表得P <0.05，按0.05α=水准拒绝0H ，接受1H ,即4种镇痛方法的效果不全相同。

四、习题（一）单项选择题1. 关于样本率p 的分布正确的说法是： A ．服从正态分布 B ．服从2χ分布C ．当n 足够大，且p 和1-p 均不太小，p 的抽样分布逼近正态分布D ．服从t 分布 2. 以下说法正确的是： A ．两样本率比较可用u 检验 B ．两样本率比较可用t 检验 C ．两样本率比较时，有2χ=u D ．两样本率比较时，有22χ=t 3. 率的标准误的计算公式是： A ．)1(p p - B ．n p p )1(- Ｃ．1-n p Ｄ．np p )1(- 4. 以下关于2χ检验的自由度的说法，正确的是： A ．拟合优度检验时，2-=n ν（n 为观察频数的个数） B ．对一个43⨯表进行检验时，11=ν C ．对四格表检验时，ν=4D ．若2,05.02,05.0ηνχχ>，则ην>5. 用两种方法检查某疾病患者120名，甲法检出率为60%，乙法检出率为50%，甲、乙法一致的检出率为35%，问两种方法何者为优？A ．不能确定B ．甲、乙法一样C ．甲法优于乙法D ．乙法优于甲法6．已知男性的钩虫感染率高于女性。

今欲比较甲乙两乡居民的钩虫感染率，适当的方法是： A ．分性别比较 B ．两个率比较的2χ检验 C ．不具可比性，不能比较 D ．对性别进行标准化后再做比较 7．以下说法正确的是A ．两个样本率的比较可用u 检验也可用2χ检验B ．两个样本均数的比较可用u 检验也可用2χ检验C ．对于多个率或构成比的比较，u 检验可以替代2χ检验D ．对于两个样本率的比较，2χ检验比u 检验可靠（二）名词解释1．实际频数与理论频数 2． 2χ界值表 3．拟合优度 4．配对四格表5．双向有序分类资料 6．率的标准误7．多个率的两两比较 8． Fisher 精确概率 9． McNemar 检验 10． Yates 校正（三）是非题四个样本率做比较，2)3(05.02χχ> ，可认为各总体率均不相等。

（四）计算题1．121名前列腺癌患者中，82名接受电切术治疗，术后有合并症者11人；39名接受开放手术治疗，术后有合并症1人。