统计学教案习题08卡方检验

合集下载

卡方检验例题与解析

卡方检验例题与解析

卡方检验例题与解析卡方检验是一种常见的假设检验方法。

它可以用于判断两个分类变量之间是否存在关联。

在实际应用中,卡方检验常常被用于分析调查数据、医学研究以及质量控制等领域。

下面我们就以一个卡方检验的例题来详细讲解该方法的步骤和解析。

例题:某医院调查100名糖尿病患者的主要症状和服药情况,结果如下表所示。

其中0表示未服药,1表示已服药,结果表格中的数值为各种情况下的人数。

| | 服药情况 | 未服药 | 已服药 || :- | :- | :- | :- || 症状 | 无 | 30 | 20 || | 微弱 | 10 | 10 || | 轻度 | 25 | 15 || | 中度 | 20 | 5 || | 重度 | 5 | 0 |问题:主要症状是否与服药情况有关?步骤1:构造假设首先,我们要明确研究的问题是主要症状是否与服药情况有关。

因此,我们要构造如下的假设:- 零假设 H0:主要症状和服药情况之间不存在关联,即服药情况对主要症状没有影响。

- 备择假设 H1:主要症状和服药情况之间存在关联,即服药情况对主要症状有影响。

步骤2:计算期望频数为了进行卡方检验,我们需要先计算期望频数。

期望频数是指在假设零假设 H0 成立的情况下,我们预计每个分类变量的频数应该是多少。

具体地,我们可以用以下公式来计算期望频数:期望频数 = (行总计数× 列总计数) ÷ 样本总计数在本例中,样本总计数为 100,行总计数为 5,列总计数为 2。

因此,我们可以使用如下的表格来计算期望频数:| | 服药情况 | 未服药 | 已服药 | 行总计数 | 期望频数(未服药) | 期望频数(已服药) || :- | :- | :- | :- | :- | :- | :- || 症状 | 无 | 30 | 20 | 50 | 25 | 25 || | 微弱 | 10 | 10 | 20 | 10 | 10 || | 轻度 | 25 | 15 | 40 | 20 | 20 || | 中度 | 20 | 5 | 25 | 12.5 | 12.5 || | 重度 | 5 | 0 | 5 | 2.5 | 2.5 || 列总计数 | 70 | 50 | 100 |步骤3:计算卡方值和自由度计算卡方值的公式如下:X² = ∑ [(观察频数 - 期望频数)² / 期望频数]其中,观察频数是指实际样本中各分类变量的频数,期望频数是指在假设 H0 成立的情况下,我们预计各分类变量的频数。

方差分析卡方检验练习题

方差分析卡方检验练习题

方差分析与卡方检验练习题本练习题涵盖了方差分析和卡方检验的基概念、方法和应用,包含不同难度等级的题目,旨在帮助学习者巩固知识,提高分析问题和解决问题的能力。

第部分:方差分析 (ANOVA)一、单因素方差分析1. 基本概念题 (500字)简述方差分析的基本思想和假设条件。

* 解释方差分析中组间方差、组内方差和总方差的概念,以及它们之间的关系。

* 说明F检的原理以及在方差分析中的应用。

* 解释方差分析结果中的P值及其意义。

* 比较方差分析与t检验的异同点。

2. 计算题 (000字)某研究者想比较三种不同肥料对小麦产量的影响。

他随机选择了三个地块,每个地块种植了相同数量的小麦,分别施用三种不同的肥料A、B、C。

收获后,测得三个地块的小麦产量如下(单位:k/亩):肥料A:15, 18, 16, 17, 19 肥料B:20, 22, 21, 19, 23 肥料C:12, 14, 13, 5, 16请根据以上数据,进行单因素方差分析,判断三种肥料对小麦产量是否有显著性差异。

(需写出详细的计算步骤,包括自由度、平方和、均方、F值、P值等,并进行结果解释。

). 应用题 (1000字)一家公司想比较四种不同广告策略对产品销量的影响。

他们随机选择了四个地区,每个地区采用一种不同的广告策略。

三个月后,测得四个地区的销售额如下(单位:万元):策略A:10, 110, 95, 105 策略B:120, 130, 115, 125 策略C:80, 90, 75,85 策略D:150, 60, 145, 155(1)请根据以上数据,进行单因素方差分析,判断四种广告策略对产品销量是否有显著性差异。

(需写出详细的计算步骤,并进行结果解释。

)(2)如果发现有显著差异,请进行事后检验(例如Tukey检验或LSD检验),找出哪些广告策略之间存在显著性差异。

(需说明所用检验方法的原理和步骤)二、双因素方差分析 (1500字)1. 基本概念题 (50字)•解释双因素方差分析的概念和应用场景。

卡方检验例题

卡方检验例题

卡方检验例题卡方检验是统计学常用的一种方法,用来说明两个变量之间的相关性。

它是由Karl Pearson在1900年提出的,所以也叫做卡方检验(Chi-Square Test)。

以下,我们以一个实际例题为例,来介绍一下卡方检验的应用。

假设有一组数据,其中涉及两个变量:性别和哪个电视栏目是最受欢迎的。

| |News |Movie |Sports||-------|------|------|------||男性 |110 |120 |70 ||女性 |90 |60 |40 |现在,我们想知道性别和最受欢迎的电视栏目之间是否有相关性。

具体来说,我们要研究的问题是:在这个数据集中,性别和最受欢迎的电视栏目之间是否有显著的关联?接下来,我们会分步骤地进行卡方检验。

第一步:设立假设首先,我们需要根据研究问题,设立一个原假设和一个备择假设。

在这个例子中,原假设(H0)是:“性别和最受欢迎的电视栏目之间没有相关性”,备择假设(H1)是:“性别和最受欢迎的电视栏目之间有一定的相关性”。

在进行卡方检验时,我们需要基于这两个假设来进行推断。

第二步:计算期望值接下来,我们需要计算每个单元格的期望值。

期望值是指在没有性别和电视栏目之间相关性的情况下,在每个单元格中出现的预期人数。

具体计算方法可以用以下公式来表示:期望值 = (行总数× 列总数) / 总人数对于上表中的数据,期望值可以用以下公式来计算:$E_{1,1}=(110+90)×(110+120+70+60+40)/300=95.33$$E_{1,2}=(110+90)×(110+120+70+60+40)/300=110.67$$E_{1,3}=(110+90)×(110+120+70+60+40)/300=74$$E_{2,1}=(120+60)×(110+120+70+60+40)/300=104$$E_{2,2}=(120+60)×(110+120+70+60+40)/300=120$$E_{2,3}=(120+60)×(110+120+70+60+40)/300=80$其中,$E_{i,j}$表示第i行,第j列的期望值。

08卡方检验

08卡方检验
R×R配对资料 分析:相关分析(2检验)
统计比较(2检验、其它)
2×2配对资料
表7-10 两种培养基培养结果
甲培养基
+ - 合计
乙培养基


22
18
2
14
24
32
合计
40 16 56
2×2配对资料
配对2检验: 目的:两种方法的检出率比较
专用公式(b+c≥40)和校正公式( b+c< 40) :
• H0:两种方法测定的结果无相关 • H1:两种方法测定的结果相关
0.05
• 因为n=60>40,Tmin=6.90 >5,用四
格表 2 检验的专用公式: • 得卡方值为0.003,P >0.9 ,按 0.05
水准,不拒绝H0,接受H1,差异无统计 学意义,不可认为甲乙两种方法的测定 结果有相关。
14
28 50.0
24
40 40.0
行×列表资料的2检验
多个两分类样本资料的比较 多分类样本资料的比较 分类资料的相关分析 专用公式:
2 n( A2 1) nR nC
完全随机设计下两组频数分布 的2检验-2×C列联表
表7-5 某地城市和农村已婚妇女避孕方法比较
地区 节育环 避孕药 避孕套 其它 合计
配对2检验
甲法
+ - 合计
乙法


16
26
7
11
23
37
合计
42 18 60
• H0:两种方法测定的阳性率相同,即B =C
• H1:两种方法测定的阳性率不同,即B ≠C
0.05
• 对于上表数据,因为b+c = 26 + 7 = 33 <40,用配对四格表卡方检验的校正公 式:

《卡方检验》课件

《卡方检验》课件

制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。

卡方检验教案高中数学

卡方检验教案高中数学

卡方检验教案高中数学
一、教学目标:
1. 掌握卡方检验的基本原理和计算方法。

2. 理解卡方检验在统计学中的应用。

3. 能够运用卡方检验解决实际问题。

二、教学重点和难点:
1. 卡方检验的基本原理和计算方法。

2. 如何应用卡方检验解决实际问题。

三、教学内容:
1. 卡方检验的基本概念和原理。

2. 卡方检验的计算方法。

3. 卡方检验在实际问题中的应用。

四、教学过程:
1. 导入阶段:通过引入一个实际问题引起学生的兴趣和思考,如某班男女生在数学考试成绩上的差异是否存在显著性。

2. 讲解卡方检验的基本概念和原理:介绍卡方检验的定义、假设、计算公式等。

3. 案例分析:老师给出一个具体的实际问题,让学生通过计算卡方值和查表得出结论。

4. 练习和讨论:让学生自己尝试计算一些卡方检验的例题,并进行讨论和解答。

5. 总结和拓展:总结卡方检验的要点,并拓展应用。

五、教学方法:
1. 探究式学习:通过引入问题激发学生的兴趣和思考,让学生主动参与讨论和解答。

2. 合作学习:让学生分组进行练习和讨论,促进学生之间的合作和交流。

3. 提问辅导:通过提问引导学生思考,帮助学生理解和掌握知识。

4. 实践操作:让学生自己进行实际计算,加深对知识的理解。

六、教学评估:
1. 及时进行课堂小测验,检查学生对卡方检验的理解和掌握情况。

2. 考核学生通过解答实际问题应用卡方检验的能力。

以上是一份简单的卡方检验教案范本,可根据具体的教学需求和学生水平进行调整和优化。

希望对您有帮助!。

卡方检验

卡方检验

第九章 2χ检验[教学要求]掌握:单个样本分布的拟合优度检验;独立样本2×2列联表资料的χ2检验;独立样本R ×C 列联表资料的χ2检验;配对2×2列联表资料的χ2检验。

熟悉:配对R × R 列联表资料的χ2检验;四格表资料的Fisher 确切概率法。

了解:连续型随机变量的χ2分布;分类数据χ2检验的基本思想。

[重点难点]第一节2χ分布和拟合优度检验一、χ2分布基本概念:χ2分布是一种连续型随机变量的概率分布,如果12,,,Z Z Z ν 是v 个相互独立的标准正态分布随机变量,则22221νZ Z Z +++ 的分布称为服从自由度为ν的χ2分布。

2χ分布的概率密度曲线的形状依赖于自由度ν的大小。

二、拟合优度χ2检验的基本思想拟合优度检验是根据样本的频率分布检验其总体分布是否符合某给定的理论分布。

2χ值反映了样本实际频率分布与理论分布的符合程度。

三、χ2检验的基本公式大样本时检验统计量∑=-=ki ii i T T A 122)(χ近似地服从χ2分布,自由度为ν= k -1-(计算T i 时利用样本资料估计的参数个数)其中,A i 和T i 分别为实际观察频数和0H 成立时的理论频数,k 为频数分布的类别总数。

四、拟合优度χ2检验注意事项1.分组不同拟合的结果可能不同,一般要求分组时每组中的理论频数不小于5。

2.需要有足够的样本含量,如果样本含量不大,需要经连续性校正,校正的公式为∑=--=ki ii i T T A 122)5.0(χ第二节 独立样本2×2列联表资料的χ2检验一、2×2列联表资料χ2检验目的两独立样本率差异的比较。

即根据两独立样本的频率分布,检验两个样本的总体分布是否相同。

二、统计量计算公式可直接使用χ2检验基本公式也可使用等价的专用公式或校正公式。

专用公式22()()()()()ad bc n a b c d a c b d χ-=++++校正公式22(||/2)()()()()ad bc n n a b c d a c b d χ--=++++自由度ν=1。

统计学教程-卡方检验

统计学教程-卡方检验

Lower
Upper
3.000
.992
9.068
2.500
.987
.833
.684
100
6.334 1.016
❖ 结果显示,OR=3.00,说明吃了该食物者发生食物中
毒的可能性是没有吃该食物者的3.00倍?
分层卡方检验
例4 某研究人员对3家医院的卫生服务情况进行 了调查,现希望分析寻求就诊和性别之间有无 联系。(数据见cmh.sav)
Exact Sig. (1-sided)
Likelihood Ratio
14.550
1
.000
Fisher's Exact Test
.000
.000
Linear-by-Linear Associ ati on
13.910
1
.000
McNemar Test
.013c
N of Valid Cases
58
poison
Yes 10
No 30
6.4
33.6
6
54
9.6
50.4
16
84
16.0
84.0
Total 40
40.0 60
60.0 100 100.0
❖ 这就是两变量的四格表。
两分类变量间关联程度的度量
结果分析
Chi-Square Tests
Pearson Chi-Square Continuity Correction a
a. Computed onlyfor a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 5. 16.

单个正态总体方差的卡方检验教案

单个正态总体方差的卡方检验教案

单个正态总体方差的卡方检验教案下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。

文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!本店铺为大家提供各种类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you! In addition, this shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!单个正态总体方差的卡方检验教案引言在统计学中,方差是一种描述数据分布离散程度的重要指标。

第8章卡方检验 SPSS卫生统计学

第8章卡方检验 SPSS卫生统计学

结果
五、配对设计 (二)R×R列联表
例8-6
六、四格表的确切概率法(例8-7)
总例数小于40,且有1个格子的理论频数小 于5,读取fisher‘s exact test结果p=0.214
练习
课本169-171页 练习题1、3、5、6
课外延伸内容
Kappa一致性检验
用于检验两种方法结果的一致程度。 crosstabs→statictics:选Kappa exact:选exact
其他两两比较时
设定A组与C组比较 If:组别~=2 或者:If:组别=1∣组别=3
如果想对其中的两个率进行相 互比较时,最好能够采用更加复 杂的分类数据模型,如对数线性 模型或者logistic回归模型进行分 析。 采用列联表分割等方法只能得 到近似的结果。
五、配对设计 (一)配对设计四格表(2×2列联表)
3、anylyze→descriptive statistics→crosstabs
第一个表显示数据处理概况:有效数据 例数、无效数据例数、总例数
第二个表显示列联表的资料,一个期望频数小于5(4.8)
结论:有1个格子的期望频数大于1,小于5,最小 期望频数为4.80 连续校正卡方值(continuity correction) x2=2.624, p=0.105>0.05,差别没有统计学意义。
Kappa检验会利用列联表中的全部信息,而 McNemar检验只关心两者不一致的情况。 对于一致性较好,即绝大多数数据都在主对 角线上的大样本列联表, McNemar检验 可能会失去使用价值。 如对1万个案例进行一致性评价,9995个都 是完全一致的,显然,一致性相当的好, 但McNemar检验只考虑不一致的数据, 反而可能得出有差异的结论。

第八章 卡方检验

第八章  卡方检验

20(25.8) 24(18.2) 21(15.2) 5(10.8) 41 29
表8-1中是两组样本的频数分布。我们的问题是 这两个频数分布的总体分布是否相等?或者这 两份样本是否来自同一个总体? 因为这里是二分类变量,问两个总体分布是否 相等就相当于问两组样本的总体有效率是否相 等。 四个格子的数据20、24、21、5是基本数据,其 余的数据44、25、41、29、70都是从这四个数 据计算得来的,因此,该表称为四格表 (fourfold table ),又称为2 × 2列联表。 在此四格表中, 20、24、21、5是实际频数A, 在这四个数字旁边括号内的数字是理论频数T, 通过实际频数和理论频数的差异的大小可以确 定 χ2 检验中检验统计量的大小。
2(d)0.85 14(固定值) 5 (固定值) 82 (固定值)
假设检验的过程
1.建立假设: H0 : π 1 = π 2 H1 : π 1 ≠ π 2 2.确定显著性水平, α取0.05。 3.确定比当前表格更极端表格的组合数,并计算 概率值P。 4.做出结论
在边缘合计数不变的条件下,比当前四 格表更极端的组合情况可根据最小的理 论频数所在的格子来寻找。本例中为d。 实际频数为2,理论频数为0.8536。差值 为1.15。所以d取值为2,3,4,5,这4 种组合就是满足条件的四格表。计算它 们的概率之和为0.20。 因为P > 0.05;不拒绝H0,差异无 统计学意义,还不能认为两组患者的 病死率存在差异。
42 2 ( 2 × 9 − 26 × 5 − ) × 42 2 2 χ = 28 × 14 × 7 × 35 = 3.62
V=(2-1)( ( )(2-1)=1 )( )
=3.62 < 3.84, P > 0.05;不拒绝H0, 差异无统计学意义,还不能认为两个年级学生 的近视眼患病率有差异。

卡方检验例题

卡方检验例题

卡方检验例题卡方检验是一种用来检验观察值与理论值之间差异的方法,是一种常用的非参数假设检验方法。

在本篇文档中,我们将为大家介绍卡方检验的基本概念以及一个具体的例题解析。

基本概念在了解卡方检验之前,我们需要先了解一下以下几个基本概念:•观察值:指实际调查或实验中得到的某一类别的数量。

•理论值:指在该种情况下,如果服从某种假设分布所得到的某一类别的数量。

•卡方值:衡量观察值和理论值之间差异的统计量,计算方式为将观察值与理论值的差异平方后除以理论值,然后将所有类别的结果相加得到。

•自由度:指随机变量可以自由取得的值的数目减1。

卡方检验的原假设为两组数据之间没有差异,备择假设为两组数据之间有差异。

例题解析现在我们来看一个具体的例题:在一个蓝球和红球各10个的盒子里,随机抽出了10个球,结果出现了7个蓝球和3个红球。

问你,能否认为这个盒子里的蓝球和红球数量相等?解析:根据题意,我们可以得出观察值为7和3,理论值应该是5和5,如果两组数据之间没有差异,那么我们可以使用卡方检验来检验。

首先,我们需要列出以下的交叉列表格:颜色实际数量预期数量实际数量-预期数量差异平方差异平方/预期数量蓝色7 5 2 4 0.8红色 3 5 -2 4 0.8总计10 10 8 1.6然后,我们可以根据卡方检验公式来计算卡方值:$X^2=\\sum_{i=1}^{n} \\frac{(O_i-E_i)^2}{E_i}$其中,O i为观察值,E i为理论值,n为类别总数。

代入数据后计算得:$X^2=\\frac{(7-5)^2}{5}+\\frac{(3-5)^2}{5}=1.6$接下来,我们需要确定自由度。

自由度的计算公式为:自由度=类别总数-1。

在本例中,我们有2个类别,因此自由度为1。

最后,我们需要根据自由度和显著性水平(通常为0.05或0.01)查找卡方分布表来确定临界值。

在自由度为1,显著性水平为0.05时,临界值为3.84;在显著性水平为0.01时,临界值为6.63。

医学统计学课件卡方检验

医学统计学课件卡方检验

队列研究中的卡方检验
总结词
在队列研究中,卡方检验用于比较不同暴露 水平或不同分组在某个分类变量上的分布差 异,以评估暴露因素与疾病发生之间的关系 。
详细描述
队列研究是一种前瞻性研究方法,按照暴露 因素的不同将参与者分为不同的组,追踪各 组的疾病发生情况。通过卡方检验,可以比 较不同暴露水平或不同分组在分类变量上的 分布差异,如分析不同饮食习惯的人群中患
卡方检验与相关性分析的区别
卡方检验主要用于比较实际观测频数与期望频数之间的差异,而相关性分析则用于研究 两个或多个变量之间的关联程度。
卡方检验与相关性分析的联系
在某些情况下,卡方检验的结果可以为相关性分析提供参考,帮助了解变量之间的关联 程度。
05
卡方检验的应用实例
病例对照研究中的卡方检验
总结词
02
公式
卡方检验的公式为 $chi^{2} = sum frac{(O_{ij} - E_{ij})^{2}}{E_{ij}}$,
其中 $O_{ij}$ 表示实际观测频数,$E_{ij}$ 表示期望频数。
03
适用范围
卡方检验适用于两个分类变量的比较,可以用于分析病例对照研究、队
列研究等类型的研究。
卡方检验的用途
如比较不同年龄组、性别组等人群中某种疾病的患病率。
卡方检验的基本假设
每个单元格中的期望 频数应该大于5。
卡方检验对于样本量 较小的情况可能不适 用。
观察频数与期望频数 应该服从相同的概率 分布。
02
卡方检验的步骤
收集数据
01
02
03
确定研究目的
在开始卡方检验之前,需 要明确研究的目的和假设 ,以便有针对性地收集数 据。

统计学教案习题08卡方检验

统计学教案习题08卡方检验

第八章 2χ检验一、教学大纲要求(一) 掌握内容 1. 2χ检验的用途。

2. 四格表的2χ检验。

(1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。

3. 行⨯列表的2χ检验。

(二) 熟悉内容频数分布拟合优度的2χ检验。

(三) 了解内容 1.2χ分布的图形。

2.四格表的确切概率法。

二、教学内容精要(一)2χ检验的用途2χ检验(Chi-square test )用途较广,主要用途如下:1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二)2χ检验的基本思想1.2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。

在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2χ值不应该很大,若实际计算出的2χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。

2. 基本公式:()∑-=TT A 22χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。

四格表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2χ值是一致的。

(三)率的抽样误差与可信区间 1.率的抽样误差与标准误样本率与总体率之间存在抽样误差,其度量方法: np )1(ππσ-=,π为总体率,或 (8-1)np p S p )1(-=, p 为样本率; (8-2) 2.总体率的可信区间当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。

总体率的可信区间:(p p S u p S u p ⨯+⨯-2/2/,αα)。

(8-3) (四)2χ检验的基本计算表8-12检验的用途、假设的设立及基本计算公式01四格表①独立资料两样本率的比较②配对资料两 样本率的比较0H :两总体率相等 1H :两总体率不等①专用公式)(22nbc ad -=χ 1②当n ≥40但1≤T<5时,校正公式))()()(()2/(22d b c a d c b a n n bc ad ++++--=χ③配对设计cb c b +--=22)1(χR ⨯C 表①多个样本率、 构成比的比较②两个变量之 间关联性分析0H :多个总体率(构成比)相等(0H :两种属性间存在关联)1H :多个总体率(构成比)不全相等(0H :两种属性间存在关联))1(22-=∑CR n n A n χ (R-1)(C-1)频数分布表 频数分布的拟合优度检验0H :资料服从某已知的理论分布 1H :资料不服从某已知的理论分布∑-TT A 2)( 据频数表的组数而定(五)四格表的确切概率法:当四格表有理论数小于1或n <40时,宜用四格表的确切概率法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八章2χ检验一、教学大纲要求(一) 掌握内容 1. 2χ检验的用途。

2. 四格表的2χ检验。

(1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。

3. 行⨯列表的2χ检验。

(二) 熟悉内容频数分布拟合优度的2χ检验。

(三) 了解内容 1.2χ分布的图形。

2.四格表的确切概率法。

二、教学内容精要(一) 2χ检验的用途2χ检验(Chi-square test )用途较广,主要用途如下:1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想1.2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。

在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2χ值不应该很大,若实际计算出的2χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。

2. 基本公式:()∑-=TT A 22χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。

四格表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2χ值是一致的。

(三)率的抽样误差与可信区间 1.率的抽样误差与标准误样本率与总体率之间存在抽样误差,其度量方法:np )1(ππσ-=,π为总体率,或 (8-1)np p S p )1(-=, p 为样本率; (8-2)2.总体率的可信区间当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。

总体率的可信区间:(p p S u p S u p ⨯+⨯-2/2/,αα)。

(8-3) (四)2χ检验的基本计算表8-1 2χ检验的用途、假设的设立及基本计算公式资料形式用途0H 、1H 的设立与计算公式自由度四格表①独立资料两 样本率的比较②配对资料两 样本率的比较0H :两总体率相等 1H :两总体率不等①专用公式))()()(()(22d b c a d c b a nbc ad ++++-=χ②当n ≥40但1≤T<5时,校正公式))()()(()2/(22d b c a d c b a n n bc ad ++++--=χ ③配对设计cb c b +--=22)1(χ1R ⨯C 表①多个样本率、 构成比的比较②两个变量之 间关联性分析0H :多个总体率(构成比)相等(0H :两种属性间存在关联)1H :多个总体率(构成比)不全相等(0H :两种属性间存在关联))1(22-=∑CR n n A n χ(R-1)(C-1)频数分布表 频数分布的拟合优度检验0H :资料服从某已知的理论分布 1H :资料不服从某已知的理论分布∑-TT A 2)(据频数表的组数而定(五)四格表的确切概率法:当四格表有理论数小于1或n <40时,宜用四格表的确切概率法。

(六)2χ检验的应用条件及注意事项1.分析四格表资料时,应注意连续性校正的问题,当1<T <5,n >40时,用连续性校正2χ检验;T ≤1,或n ≤40时,用Fisher 精确概率法。

2.对于R ⨯C 表资料应注意以下两点:(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5;(2)注意考察是否有有序变量存在。

对于单向有序R ⨯C 表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R ⨯C 表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R ⨯C 表资料,为考察两种方法检测的一致性,应选用Kappa 检验。

三、典型试题分析(一)单项选择题1.下列哪项检验不适用2χ检验( )A . 两样本均数的比较B . 两样本率的比较C . 多个样本构成比的比较D . 拟合优度检验答案:A [评析] 本题考点:2χ检验的主要用途。

2χ检验不能用于均数差别的比较。

2.分析四格表时,通常在什么情况下需用Fisher 精确概率法( )A .1<T <5,n>40B .T <5C .T 1≤或n 40≤D .T 1≤或n 100≤答案: C [评析] 本题考点:对于四格表,当T 1≤或n 40≤时,不宜用2χ检验,应用Fisher 精确概率法。

3.2χ值的取值范围为A .∞-<2χ<∞+ B .+∞≤≤20χ C .12≤χ D .02≤≤∞-χ答案: B [评析]根据2χ分布的图形或2χ的基本公式可以判断2χ值一定是大于等于零且没有上界的,故应选B 。

(二)是非题两样本率的比较可以采用2χ检验,也可以采用双侧u 检验。

答案:正确。

[评析]就两个样本率的比较而言,双侧u 检验与2χ检验是等价的。

(三)简答题1.四格表的2χ检验和u 检验有何联系与区别?答案:相同点:凡是能用u 检验进行的两个率比较检验的资料,都可用2χ检验,两者是等价的,即22χ=u ;相异点:(1)u 检验可进行单侧检验;(2)满足四格表u 检验的资料,计算两个率之差的可信区间,可从专业上判断两率之差有无实际意义;(3)2χ检验可用于2⨯2列联表资料有无关联的检验。

2.R ⨯C 表2χ检验的适用条件及当条件不满足时可以考虑的处理方法是什么?答案:R ⨯C 表2χ检验的适用条件是理论频数不宜过小,否则有可能产生偏性。

当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。

但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。

(四)计算题1.为研究静脉曲张是否与肥胖有关,观察122对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。

表8-2 122对同胞兄弟静脉曲张发生情况正常体重 肥胖合计 发生 未发生 发 生19 5 24 未发生 12 86 98 合 计31 91122[评析]这是一个配对设计的资料,因此用配对2χ检验公式计算。

H 0:肥胖者与正常体重者的静脉曲张发生情况无差别 H 1:肥胖者与正常体重者的静脉曲张发生情况不同 05.0=α cb c b +--=22)1(χ=()12.212511252=+--,1=ν2χ=2.11<21,05.0χ,P >0.05,尚不能认为静脉曲张与肥胖有关。

2.某卫生防疫站在中小学观察三种矫正近视眼措施的效果,近期疗效数据见表8-3。

对三种措施的疗效作出评价。

夏天无眼药水 51 84 135 37.78 新医疗法 6 26 32 18.75 眼保健操 5 13 18 27.78 合计 62 123 18533.51[评析]0H :三种措施有效率相等1H :三种措施有效率不相等或不全相等 05.0=α)1(22-=∑cr n n A n χ=185⨯⎪⎪⎭⎫ ⎝⎛-⨯+⨯+⨯+⨯+⨯+⨯1181231318625321232632626135123841356251222222=4.498,ν=(2-1)(3-1)=2.查表得0.25>P >0.10,按0.05α=水准不拒绝0H ,尚不能认为三种措施有效率有差别。

3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见表8-4,问4种镇痛方法的效果有无差异?表8-4 4种镇痛方法的效果比较 镇痛方法 例数 有效率(%) 颈麻 100 41 注药 100 94 置栓 100 89 对照 100 27[评析] 为了应用2χ检验,首先应计算出有效和无效的实际频数,列出计算表,见表8-5。

颈麻 41 59 100 注药 94 6 100 置栓 89 11 100 对照 27 73 100 合计 251 149 400 0H :4种镇痛方法的效果相同 1H :4种镇痛方法的效果不全相同05.0=α)1(22-=∑c r n n A n χ=400⎪⎪⎭⎫⎝⎛-⨯++⨯+⨯⨯110014973...1001495910025141222=146.175, ν=(4-1)(2-1)=3查表得P <0.05,按0.05α=水准拒绝0H ,接受1H ,即4种镇痛方法的效果不全相同。

四、习 题(一) 单项选择题1. 关于样本率p 的分布正确的说法是: A . 服从正态分布 B . 服从2χ分布C . 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布D . 服从t 分布 2. 以下说法正确的是: A . 两样本率比较可用u 检验 B . 两样本率比较可用t 检验 C . 两样本率比较时,有2χ=u D . 两样本率比较时,有22χ=t 3. 率的标准误的计算公式是: A .)1(p p - B .n p p )1(- C.1-n p D.np p )1(- 4. 以下关于2χ检验的自由度的说法,正确的是: A .拟合优度检验时,2-=n ν(n 为观察频数的个数) B .对一个43⨯表进行检验时,11=νC .对四格表检验时,ν=4D .若2,05.02,05.0ηνχχ>,则ην>5. 用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?A .不能确定B .甲、乙法一样C .甲法优于乙法D .乙法优于甲法6.已知男性的钩虫感染率高于女性。

今欲比较甲乙两乡居民的钩虫感染率,适当的方法是: A .分性别比较 B .两个率比较的2χ检验 C .不具可比性,不能比较 D .对性别进行标准化后再做比较 7.以下说法正确的是A .两个样本率的比较可用u 检验也可用2χ检验B .两个样本均数的比较可用u 检验也可用2χ检验C .对于多个率或构成比的比较,u 检验可以替代2χ检验D .对于两个样本率的比较,2χ检验比u 检验可靠 (二) 名词解释1. 实际频数与理论频数 2. 2χ界值表 3. 拟合优度 4. 配对四格表5. 双向有序分类资料 6. 率的标准误7. 多个率的两两比较 8. Fisher 精确概率 9. McNemar 检验 10. Yates 校正 (三) 是非题四个样本率做比较,2)3(05.02χχ> ,可认为各总体率均不相等。

(四) 计算题1.121名前列腺癌患者中,82名接受电切术治疗,术后有合并症者11人;39名接受开放手术治疗,术后有合并症1人。

相关文档
最新文档