医学统计学-第8章 卡方检验
卡方检验医学统计学

卡方检验医学统计学卡方检验是医学统计学中最常用的检验方法之一,它可用于测量两组数据之间的关联性。
在研究中,我们常常需要探究二者之间是否存在某种关联,卡方检验就是我们解决这个问题的利器。
卡方检验的原理卡方检验的原理是基于期望频数和实际频数的差异来检验两个变量之间的关系。
期望频数指的是在假设两个变量独立的情况下,我们可以根据样本量和其他条件,计算出不同组之间的理论值。
而实际频数则是实验中观察到的实际结果。
卡方检验的步骤如下:1.建立零假设和备择假设。
零假设指的是假设两个变量之间不存在任何关系,备择假设则是反之。
2.确定显著性水平 alpha,通常取值为0.05。
3.构建卡方检验统计量。
计算方法为将所有观察值与期望值的差平方后,再除以期望值的总和。
4.根据自由度和显著性水平,查卡方分布表得到 P 值。
5.如果 P 值小于显著性水平,拒绝零假设;否则无法拒绝零假设。
卡方检验的应用卡方检验可以应用于多个领域,其中医学统计学是最为常见的一个。
卡方检验可以用来分析两个疾病之间的相关性或者测量一种治疗方法的效果。
举个例子,某药厂要研发一种新的药物来治疗心脏病。
为了验证该药的疗效,实验组和对照组各50 人。
在 6 个月的治疗后,实验组和对照组中分别有 10 人和 15 人痊愈了。
卡方检验的作用就在于此时可以用来检验两组之间的差异是否具有统计学意义。
除了医学统计学之外,卡方检验在社会学、心理学、市场营销、物理等领域也都有广泛应用。
卡方检验的限制虽然卡方检验被广泛应用于各种实验和研究中,但它也有着自己的限制。
其中比较明显的一点就是对样本量有一定的要求。
当样本量较小的时候,期望频数的计算就会出现一定的误差,进而导致检验结果不准确。
此外,在面对非常态分布数据时,卡方检验也会出现问题。
当数据呈现正态分布时,卡方检验的准确性最高。
然而,实际上,很多数据都呈现出非正态分布,这时需要使用一些修正方法来解决。
卡方检验是医学统计学中最常用的统计方法之一,它可以用来测量两个变量之间的关联性。
医学统计学课件-卡方检验

联合治疗 39 34.44 8 12.56 47 73.3 单纯治疗 57 61.56 27 22.44 84 73.3
合计
96
35
131 73.3
Trc
nr nc n
理论频数= 84 73.3%
χ2检验的基本思想(1)
通过构造A与T吻合程度的统计量来反 映两样本率的差别!
实际数A
39
8
57
27
污染率 (%)
甲
6
23
29
79.3
乙
30
14
44
31.8
丙
8
3
11
27.3
合计
44
40
84
47.6
理论数的计算
实际数A
6
23
29
30
14
44
8
3
11
44
40
84
(52.4%) (47.6%)
理论数T
15.2 13.8
23.0 21.0
5.8
5.2
T
nR
nC N
nR nC N
2值的计算
实际数A
χ2检验相关问题-应用条件
某矿石粉厂当生产一种矿石粉石时,在数天内即有 部分工人患职业性皮肤炎,在生产季节开始,随机 抽取15名车间工人穿上新防护服,其余仍穿原用的 防护服,生产进行一个月后,检查两组工人的皮肤 炎患病率,结果如表 ,问两组工人的皮肤炎患病 率有无差别?
χ2检验相关问题-应用条件
Total
When the variables are independent, the proportion in
both groups is close to the same size as the proportion
卡方检验--医学统计学

Value Measure of Agreement N of Valid Cases a. Not assuming the null hypothesis. Kappa .455 58
b. Using the asymptotic standard error assuming the null hypothesis.
Exact Sig. (1-sided)
Value Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association McNemar Test N of Valid Cases a. Computed only for a 2x2 table 14.154b 11.836 14.550
供了完整的支持,此处只涉及两分类变量间关联程度的指
标,更系统的相关程度指标见相关与回归一章。
两分类变量间关联程度的度量
相对危险度RR:是一个概率的比值,指试验组人群反应阳性概率 与对照组人群反应阳性概率的比值。数值为1,表明试验因素与
反应阳性无关联;小于1时,表明试验因素导致反应阳性的发生
率降低;大于1时,表明试验因素导致反应阳性的发生率增加。 优势比OR:是一个比值的比,是反应阳性人群中试验因素有无的 比例与反应阴性人群中试验因素有无的比例之比。 当关注的事件发生概率比较小时(<0.1),优势比可作为相对危
df
.000
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 5. 16. c. Binomial distribution used.
医学统计学:卡方检验

CM C N M P( x ) n CN
式中X的取值是从0与(n-N+M)之较大者开始直到n与M之较小者为止。
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 超几何分布
x n x CM CN M P( x ) n CN
C
卡方检验
■ χ2检验的基本思想
卡方检验
■ χ2检验的基本思想
卡方检验
■ χ2检验的基本思想
卡方检验
■ χ2检验的基本思想
卡方检验
■ 四格表资料的χ2检验
1.当n≥40且所有的T≥5时,用χ2检验的基本公式;当P≈α时,改用四格 表资料的Fisher确切概率法。 例 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组) 降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表1 。问两组降低颅内压的总体有效率有无差别?
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 Fisher确切概率法的基本思想
在四格表周边合计数不变的条件下, 利用超几何分布直接计算样本事件及 比样本事件更极端情形发生的概率。
卡方检验
■ 四格表资料的χ2检验
3.当n<40,或T<1时,用四格表资料的Fisher确切概率法。 Fisher确切概率法的基本思想
卡方检验
■ 四格表资料的χ2检验
1.当n≥40且所有的T≥5时,用χ2检验的基本公式;当P≈α时,改用四格 表资料的Fisher确切概率法。
卡方检验
■ 四格表资料的χ2检验
1.当n≥40且所有的T≥5时,用χ2检验的基本公式;当P≈α时,改用四格 表资料的Fisher确切概率法。
统计学卡方检验

根据分析结果,为患者提供个体化的干预措施,提高生存质量。
06
卡方检验注意事项及局限 性讨论
样本量要求及抽样方法选择
样本量要求
卡方检验对样本量有一定的要求,通常建议每个单元格的期望频数不小于5,以确保检验结果的稳定性和可靠性 。当样本量不足时,可能会导致检验效能降低,增加第二类错误的概率。
抽样方法选择
在进行卡方检验时,应选择合适的抽样方法。简单随机抽样是最常用的方法,但在某些情况下,如分层抽样或整 群抽样可能更适合。选择合适的抽样方法有助于提高检验的准确性和可靠性。
期望频数过低时处理策略
合并类别
当某个单元格的期望频数过低时,可以考虑 合并相邻的类别,以增加期望频数。合并类 别时应注意保持类别的逻辑性和实际意义。
适用范围及条件
适用范围
卡方检验适用于多个分类变量之间的独立性或相关性检验,如医学、社会科学等领域的调查研究。
条件
使用卡方检验需要满足一些前提条件,如样本量足够大、每个单元格的期望频数不宜过小等。此外, 对于有序分类变量或存在空单元格的情况,需要采用相应的处理方法或选择其他适合的统计方法。
02
卡方检验方法
统计学卡方检验
目录
• 卡方检验基本概念 • 卡方检验方法 • 数据准备与预处理 • 卡方检验实施步骤 • 卡方检验在医学领域应用举例 • 卡方检验注意事项及局限性讨论
01
卡方检验基本概念
定义与原理
01
02
定义
原理
卡方检验是一种基于卡方分布的假设检验方法,用于推断两个或多个 分类变量之间是否独立或相关。
确定分组界限
在确定分组界限时,可以采用等距分组、等频分组或 基于数据分布的分组方法。选择合适的分组界限有助 于保持各组之间的均衡性,减少信息损失。
医学统计学-卡方检验

卡方检验是一种常用的统计方法,用于比较观察值和期望值之间的差异。它 在医学研究中有着广泛的应用,可以帮助我们验证假设、推断总体特征以及 分析类别变量的相关性。
卡方检验的定义和原理
卡方检验是一种基于卡方分布的统计检验方法。它基于观察值与期望值之间 的差异来判断样本数据与理论分布的拟合程度。
卡方检验的局限性和注意事项
• 卡方检验只能验证分类变量之间的关联性,不能验证因果关系。 • 卡方检验对样本足够大和数据分类合理的要求比较严格。 • 卡方检验结果受样本选择和观察误差的影响,需要谨慎解释。 • 在进行卡方检验前,需要对数据进行充分的清洗和准备。
结论和要点
卡方检验是一种常用的统计方法
卡方检验的应用领域
医学研究
卡方检验可以用来分析疾病的发生与某个因素之间的关联性,如吸烟与肺癌。
社会科学
卡方检验可以用来研究不同人群之间的行模式和态度偏好,如性别与政治观点。
市场调研
卡方检验可以用来分析消费者的购买偏好和市场细分,如年龄与产品偏好。
卡方检验的假设和前提条件
1 独立性假设
卡方检验基于观察值和期望值之间的差异来验证两个变量之间是否存在独立性。
它可以帮助我们验证假设、推断总体特征以 及分析类别变量的相关性。
结果解读和意义
卡方检验的结果可以帮助我们了解变量之间 的关系,并为决策提供依据。
应用广泛
卡方检验在医学研究、社会科学和市场调研 等领域都有着重要的应用。
局限性和注意事项
卡方检验有一定的局限性,需要注意样本大 小和数据分类的合理性。
4
比较卡方值和临界值
判断卡方值是否大于临界值,从而做出关于拒绝或接受原假设的决策。
卡方检验的结果解读和意义
《卡方检验》课件

制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。
医学统计方法之卡方检验PPT课件

3、查界值表,确定P值,做出推断结论
查χ2界值表,υ=6,χ20.05(6)=12.59, χ2 > χ20.05(1) ,则 P<0.05,在α=0.05的水准下,拒绝H0,认为三个不同地区 的人群血型分布总体构成比有差别。
.
38
二、多个样本率间多重比较
行×列表χ2检验的结果说明差异有统计学意义,需作两 两比较时,先调整α值,再进行率的两两比较。
配对检验公式推导:
bc
(+,)和(,+)两个格子中的理论频数均为
2
b c 40时
2
(AT)2(b b c )2 2(c b c)22
T
bc
bc
2
2
(b c)2
bc
~ 2 分布
同理可得b c 40时
1
校正公式: 2 (| A T | 0.5)2 (| b c | 1)2
表8-5 两种培养基的培养结果
B培养基
A培养基
+
-
合计
+
48
24
72
-
20
106
126
合计
68
130
198
A 培养基 B培养基
痰标本 1 2 3 4 5 6 7 8 9 10 11 12 13 14
结果统计
A培养基 + + + + + + + + + + -
B培养基 + + + + + + + -
合计
145 109 254 57.09
1.建立检验假设并确定检验水准
医学统计学卡方检验

03 左侧概率为P =P1+ P2 + P3 =0.316 , 右侧概率为P =P3+ P4 + P5 + P6 =0.929,故单侧检验P值为0.316。
Part 02.
配对四格表资料的 检验
χ2
概述
计数资料的配对设计常用于两种检验方 法、培养方法、诊断方法的比较。 特点是对样本中各观察单位分别用两种 方法处理,然后观察两种处理方法的某 两分类变量的计数结果,整理为
的条件下,利用超几何分布
Fisher确切概率法的基本思想
(hypergeometric distribution)公式直接计算 表内四个格子数据的各种组合 的概率,然后计算单侧或双侧
“!”为阶乘符号, n !=1×2×…×n,0 !=1, ∑Pi=1。
累计概率,并与检验水准比较,
P( ab)( c 作! 出 a 是! 否db 拒! ) 绝cH! ( 0a d 的! ! 结 论n! 。c)( b!d)!
当T<1或n<40,四格表资料χ2检验结果 可能会有偏性,需采用Fisher确切检验 进行分析。该法由R. A. Fisher提出,且 直接计算概率,因此也叫Fisher确切概 率检验(Fisher’s exact probability test)。
四格表资料的Fisher确切概率法
在四格表周边合计数固定不变
否有差别?
⑴设H0 :π1=π2 ,即两药有效率相同;H1 : π1≠π2 α=0.05
⑵n>40,Tmin>5
2 5 5 2 . 1 7 2 8 1 1 9 . 8 3 2 2 3 3 9 . 8 3 2 2 3 8 . 1 2 8 6 . 48 5 . 1 7 81 . 8 3 23 . 8 3 28 . 18
“医学统计课件-卡方检验”

卡方检验中的显著性水平和p 值
显著性水平和p值是判断卡方检验结果是否显著的重要指标。我们将解释它们 的概念和计算方法,并讨论常用的显著性水平选择。
卡方检验的优缺点
卡方检验是一种简单有效的统计方法,但也有其局限性。我们将讨论卡方检 验的优点和不足之处,以及与其他统计方法的比较。
单样本卡方检验的原理和步骤
单样本卡方检验用于比较一个分类变量的观察频数与期望频数之间的差异。 我们将介绍其原理、计算方法和实际操作步骤。
独立性卡方检验的原理和步骤
独立性卡方检验用于判断两个分类变量之间是否存在相关性。我们将详细解 释它的原理、计算方法,并提供一个实际案例进行分析。
适合度卡方检验的原理和步骤
卡方检验的实际应用案例
通过实际案例,我们将展示卡方检验在医学和流行病学研究中的应用。这些 案例将帮助您更好地理解卡方检件——卡方 检验”
卡方检验是一种常用的统计方法,用于比较两个或多个分类变量之间的差异。 本课件将详细介绍卡方检验的原理、步骤、应用和优缺点,以及在医学研究 和流行病学中的实际案例。
卡方检验的分类及适用范围
卡方检验可以分为单样本卡方检验、独立性卡方检验和适合度卡方检验。每 种检验方法适用的情况略有不同,我们将详细探讨它们的应用领域和限制。
医学统计学课件卡方检验

队列研究中的卡方检验
总结词
在队列研究中,卡方检验用于比较不同暴露 水平或不同分组在某个分类变量上的分布差 异,以评估暴露因素与疾病发生之间的关系 。
详细描述
队列研究是一种前瞻性研究方法,按照暴露 因素的不同将参与者分为不同的组,追踪各 组的疾病发生情况。通过卡方检验,可以比 较不同暴露水平或不同分组在分类变量上的 分布差异,如分析不同饮食习惯的人群中患
卡方检验与相关性分析的区别
卡方检验主要用于比较实际观测频数与期望频数之间的差异,而相关性分析则用于研究 两个或多个变量之间的关联程度。
卡方检验与相关性分析的联系
在某些情况下,卡方检验的结果可以为相关性分析提供参考,帮助了解变量之间的关联 程度。
05
卡方检验的应用实例
病例对照研究中的卡方检验
总结词
02
公式
卡方检验的公式为 $chi^{2} = sum frac{(O_{ij} - E_{ij})^{2}}{E_{ij}}$,
其中 $O_{ij}$ 表示实际观测频数,$E_{ij}$ 表示期望频数。
03
适用范围
卡方检验适用于两个分类变量的比较,可以用于分析病例对照研究、队
列研究等类型的研究。
卡方检验的用途
如比较不同年龄组、性别组等人群中某种疾病的患病率。
卡方检验的基本假设
每个单元格中的期望 频数应该大于5。
卡方检验对于样本量 较小的情况可能不适 用。
观察频数与期望频数 应该服从相同的概率 分布。
02
卡方检验的步骤
收集数据
01
02
03
确定研究目的
在开始卡方检验之前,需 要明确研究的目的和假设 ,以便有针对性地收集数 据。
医学统计学卡方检验

计算期望频数
2
根据独立性假设,计算预期的频数。
3
计算卡方值
根据观察频数和期望频数,计算卡方值。
判断显著性
4
根据卡方值和自由度,判断结果是否显著。
卡方检验的计算方法
卡方检验的计算方法主要包括计算卡方值、计算自由度以及查找临界值。 计算卡方值:
1. 计算每个组别的观察频数和期望频数之差的平方。 2. 将所有差的平方相加,得到卡方值。 计算自由度: • 自由度 = (行数 - 1) * (列数 - 1) 查找临界值:
卡方检验的应用范围和特点
卡方检验广泛应用于医学研究中,例如研究疾病与风险因素之间的关联性。 卡方检验的特点包括:
非参数检验
不依赖于总体的任何参数假设。
适用性广泛
可用于分析两个或释。
卡方检验的步骤
1
收集数据
收集观察到的数据,例如不同组别的频数。
根据自由度和显著性水平,在卡方分布表中查找对应的临界值。
案例分析:卡方检验在医学统计学中的应用
临床研究
通过卡方检验分析患者病情与治疗 效果之间是否存在关联性。
遗传研究
运用卡方检验检测基因型与表型之 间的关联性。
公共卫生
分析卡方检验数据以确定风险因素 与疾病之间的关联性。
结论和总结
卡方检验是一种强大的统计工具,可用于分析变量之间的关联性。 通过掌握卡方检验的原理、应用和计算方法,我们能更好地理解数据背后的 关系,并做出有针对性的决策。
医学统计学卡方检验
卡方检验是一种常用的统计方法,主要用于比较观察到的数据与期望值之间 是否存在显著差异。
卡方检验的原理和假设
卡方检验基于观察到的频数与期望频数之间的差异,用于判断变量之间是否存在关联性。 卡方检验的假设为:
医学统计学----卡方检验

=
Xi − μ σ
χ2检验的内容
一、 χ2检验的基本思想 二、独立四格表资料的χ2检验 三、配对四格表资料的χ2检验 四、行×列表资料的χ2检验 五、多个样本率比较的χ2分割法 六、四格表资料的Fisher确切概率法 七、频数分布拟合优度的χ2检验
一、 χ2 检验的基本思想
χ2分布的概念 χ2检验的基本思想 P 值的确定 χ2 检验的基本检验步骤
表4
处理组
A B C 合计
三种脐带处理方法的脐带感染情况
脐带感染 感染 未感染
76
3143
15
2409
2
762
93
6314
合计 感染率(%)
3219
2.36
2424
0.62
764
0.26
6407
1.45
2. 样本构成比的比较
(comparison of several proportions)
例4 某医师在研究血管紧张素I转化酶(ACE)基
二、四格表资料的χ2检验
1. 四格表资料χ2 检验的专用公式
χ2 =
(ad − bc)2 n
(a + b)(c + d)(a + c)(b + d)
用四格表资料χ2专用公式计算例1的χ2值:
χ 2 = (99 × 21 − 5 × 75 ) 2 200 = 12 .86 104 × 96 × 174 × 26
处理组的例数由发生数和未发生数两部分组成。表
内有99、5、75、21 四个基本数据,其余数据均由
此四个数据推算出来的,故称四格表资料。
表2 四格表资料的基本形式
处理组 发生数 未发生数 合计
卫生统计学---卡方检验

例 某市重污染区、一般污染区和农村的出生婴儿的致畸情况如下 表,问三个地区的出生婴儿的致畸率有无差别?
表 某市三个地区出生婴儿的致畸率比较
① 建立假设 H0:π1=π2=π3 H1:π1,π2,π3之间不等或不全等。
② 确定检验水准
α=0.05
③ 计算统计量
值
2
2 n(
A2 1) nR nC
⑤ 下结论
因为P<0.05,按α=0.05的水准,拒绝H0,接受H1, 差异有统计学意义。即可认为两药治疗消化 道溃
疡的愈合率有差别,其中奥美拉唑的愈合率比雷
尼替丁愈合率高。
ห้องสมุดไป่ตู้二) 四格表的专用公式
2
(ad - bc)2 n
(a b)(c d)(a c)(b d)
a、b、c、d 分别为四格表中的四个实际频数,n为总
例3 某研究者欲比较A、B、C 三种方案治疗轻、中度高血压的疗 效,将年龄在50~70岁的240例轻、中度高血压患者随机等分为3组, 分别采用三种方案治疗。一个疗程后观察疗效,结果见表11.4。问 三种方案治疗轻、中度高血压的有效率有无差别?
表3 三种方案治疗轻、中度高血压的效果
① 建立假设
H0:π1=π2=π3 H1: 三种方案治疗轻、中度高血压的有效率不等或
(二) 两个或多个构成比的比较
例4 为了解新型农村合作医疗对于农村贫困居民住院服务利用的 影响,在经济条件相似的甲、乙两个国家级贫困县(其中甲县2006 年已开展新型农村合作医疗,乙县2006年尚未开展)分别进行抽样 调查,得到2006年应住院者未住院原因,见表11.5。问甲、乙两县 应住院者未住院原因构成比是否不同?
论频数之差相差很大,则 值相应也会很大,相应的P值也就2 越小,
(医统)卡方检验

2
观测值的自由度(vi>2),Si为第i组观测值的标 准差 2 • 拒绝原假设的条件为: 2 ,
F检验
• 检验两组观测值的方差的齐性 • 原假设: 2 2
1 2
• 检验统计量:
2 2 2 S1 F 2 2 ~ F( 1 , 2 ) 1 S2
• 拒绝条件: F F /2 (1, 2 )或F F1 /2 (1, 2 )
2.拟合优度检验
• B.表征实验分布,即用卡方统计量检验实验分布 是否服从某一理论分布(正态、二项等) • 步骤:1.将总体X的取值范围分成k个互不重迭的 小区间 • 2.计算落入第i个小区间的样本值的观测频数 • 3. 根据所假设的理论分布, 算出总体X的值落入每 个小区间的概率p,于是np就是落入该区间的样本 值的理论频数 • 4.计算卡方统计量 • 5.与临界值进行比较,进行决策
χ2 检验 数据资料 总体 检验对象
离散型资料 总体分布是未知的
连续型资料假设检验
连续型资料 正态分布 对总体参数或几个总体 参数之差
不是对总体参数的检 验,而是对总体分布 的假设检验
三、χ2 检验的用途
适合性检验
是指对样本的理论数先通过一定的理
论分布推算出来,然后用实际观测值与理论
数相比较,从而得出实际观测值与理论数之
理论值(E)
696.75 232.25 929
O-E
+8.25 -8.25 0
由于差数之和正负相消,并不能反映实 际观测值与理论值相差的大小。
为了避免正、负相抵消的问题,可将实际 观测值与理论值的差数平方后再相加,也就是 计算:
∑(O-E)2
O--实际观察的频数 E--无效假设下的期望频数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
子数目,而不是样本含量n。四格表资料只
有两行两列, =1,即在周边合计数固定的情
况下,4个基本数据当中只有一个可以自由
取值。
105
17
3. 假设检验步骤
(1) 建立检验假设,确定检验水平。
H0:π1=π2 即试验组与对照组降低颅内压的总体有效率相等 H1:π1≠π2 即试验组与对照组降低颅内压的总体有效率不相等
90.48
13.52
83.52
12.48
12.86
(2 1)(2 1) 1
105
19
以 =1 查附表 8 的 2 界值表得 P 0.005 。按 0.05 检验水准拒绝 H 0 , 接受 H1 ,可以认为两组降低颅内压总体 有效率不等,即可认为异梨醇口服液降 低颅内压的有效率高于氢氯噻嗪+地塞 米松的有效率。
X1+X2
)服从自由度
( ν1+ν2 )的 2 分布,即 ( X1 X 2 )
~
。 2
1 2
(3) 2 界值:当 确定后, 2 分布曲线下右侧尾部的 面积为 时,横轴上相应的 2 值,记作2, (见附表 8)。 2 值愈大,P 值愈小;反之, 2 值愈小,P 值愈大。
105
7
0.5
nR 为相应的行合计
nC 为相应的列合计
105
14
理论频数 T 是根据检验假设H0 :1 2 ,且用合
并率来估计 而定的。
如上例,无效假设是试验组与对照组降低颅内压的 总体有效率相等,均等于合计的有效率87%。那么 理论上,试验组的104例颅内压增高症患者中有效 者应为104(174/200)=90.48,无效者为 104(26/200)=13.52;同理,对照组的96例颅内压增 高症患者中有效者应为96(174/200)=83.52,无效者 为96(26/200)=12.48。
105
15
检验统计量 2值反映了实际频数与理
论频数的吻合程度。
若 检 验 假 设 H0:π1=π2 成 立 , 四 个 格 子 的 实 际 频数A 与理论频数T 相差不应该很大,即统计量
不应该很大。如果 2 值很大,即相对应的P 值很
小,若 P ,则反过来推断A与T相差太大,超出 了抽样误差允许的范围,从而怀疑H0的正确性, 继而拒绝H0,接受其对立假设H1,即π1≠π2 。
差别?
105
9
表7-1 两组降低颅内压有效率的比较
组 别 有效
无效
合 计 有效率(%)
试验组 99(90.48) a 5(13.52) b 104 (a+ b)
95.20
对照组 75(83.52) c 21(12.48) 合 计 174(a+c)
26(b+d)
200 (n)
105
6
一、 2 检验的基本思想
1. 2 分布
(1) 2 分布是一种连续型分布:按分布的密度函数可给出
自由度=1,2,3,……的一簇分布曲线 (图7-1)。
(2) 2 分布的一个基本性质是可加性: 如果两个独立的
随机变量X1和X2分别服从自由度ν1和ν2的分布,
即
X1
~
2 1
,
X2
~
2 2
,那么它们的和(
105
16
由公式(7-1)还可以看出: 2值的大小还取决于 (A T )2
个数的多少(严格地说是自由度ν的大小)。由于各
(
A
T T
)2
T
皆是正值,故自由度ν愈大, 2 值也会愈大;所以只有考虑
了自由度ν的影响, 2值才能正确地反映实际频数A和理论频
数T 的吻合程度。
2 检验的自由度取决于可以自由取值的格
87.00
105
10
本例资料经整理成图7-2形式,即有两
个处理组,每个处理组的例数由发生数和
未发生数两部分组成。表内有
99 75
5 21
四个
基本数据,其余数据均由此四个数据推算
出来的,故称四格表资料。
105
11
处理组 发生数 未发生数 合计
甲
a
b
a+b
乙
c
d
c+d
合 计 a+c b+d
n
图7-2 四格表资料的基本形式
• Multiple comparison of sample rates
• 2 test of goodness of fit
105
2
第一节 四格表资料的 2 检验 第二节 配对四格表资料的 2 检验 第三节 四格表资料的 Fisher确切概率法 第四节 行×列表资料的 2 检验 第五节 多个样本率间的多重比较 第六节 有序分组资料的线性趋势检验(不讲) 第七节 频数分布拟合优度的 2 检验
105
3
目的: 推断两个总体率或构成比之间有无差别
多个总体率或构成比之间有无差别 多个样本率的多重比较 两个分类变量之间有无关联性 频数分布拟合优度的检验。
检验统计量: 2
应用:计数资料
第一节 四格表资料的 2 检验
105
5
目的:推断两个总体率(构成比)是 否有差别
(和u检验等价)
要求:两样本的两分类个体数排列成四 格表资料
105
12
基本思想:可通过 2 检验的基本公式
来理解。
2 (AT)2 , (行数-1)(列数1)
T
式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。
105
13
理论频数由下式求得:
TRC
nRnC n
式中,TRC 为第R 行C 列的理论频数
α=0.05。
105
18
(2)求检验统计量值
T11 104 174 / 200 90.48 ,T12 104 90.48 13.52 T21 174 90.48 83.52 ,T22 26 13.52 12.48 。
2 (99 90.48)2 (5 13.52)2 (75 83.52)2 (21 12.48)2
第八章 卡方检验
Chi-SquareTest
105
1
Content
• 2test of fourfold data
• 2 test of paired fourfold data
• Fisher probabilities in fourfold data
• 2 test of R×C table
0.4
0.3
f (2) 0.2
0.1
1
6
10
0 0 2 4 6 8 10 12 14 16
2
105
8
2. 2 检验的基本思想
例7-1 某院欲比较异梨醇口服液(试验组)和
氢氯噻嗪+地塞米松(对照组)降低颅内压的疗
效。将200例颅内压增高症患者随机分为两组,结
果见表7-1。问两组降低颅内压的总体有效率有无