[医学]卡方检验-研究生
医学统计学6卡方检验
卡方检验的卡方值
卡方值是卡方检验的统计量,用于衡量实际观测值和期望值之间的差异。 卡方值越大,就表示观测值与期望值之间的差异越大,这意味着结论更可信。
如何进行卡方检验
第一步
确定研究的问题和相关变量, 并给出所需的假设。
第二步
收集数据并整理成交叉列联 表。
第三步
计算卡方值和自由度。
第四步
查阅卡方分布表,确定相应置信度水准下的临 界值。
2
应用
概率常用于医学研究中,以测量一种治疗对患者的疗效。
3
公式
概率=事件发生的次数/总次数。
统计学中的假设
在统计学中,我们需要制定一个或多个假设进而做出相应的决策。常见的假设有零假设和备择假设。
零假设
零假设是指不存在两个群体之间的差异。
备择假设
备择假设是指存在两个群体之间的差异。
什么是卡方检验
卡方检验是一种用于比较两个或多个群体在某些因素上的分布情况的方法。
卡方检验与其他假设检验的区 别
卡方检验主要用于回答多个分类变量间是否有关联的问题,而 T 检验和 Z 检 验主要用于回答单变量的问题。
卡方检验对于数据的类型并无太多的要求,而 T 检验和 Z 检验只适用于概率 分布为正态分布的数据。
卡方检验的计算公式
卡方检验的计算公式如下: χ² = ∑(O-E)²/E
为什么需要统计学
准确
统计学可以让我们从收集到的数据中得出真正 准确可靠的结论。
决策
统计学有助于做出决策并帮助我们更好地理解 数据背后的信息。
推断
统计学允许我们通过对大量数据的推断得到新 的信息。
掌握
掌握医学统计学对于实现优质医保研究至关重 要。
概率
医学统计学11卡方检验
卡方值和P值
卡方值是由卡方检验计算得 出的统计量,用于判断观察 值和期望值是否有显著差异。
卡方检验的使用场景
医学研究
卡方检验常用于分析医学疾病流 行病学数据,如患病率、死亡率 等。
市场调研
卡方检验可以帮助企业了解顾客 满意度,分析产品销售情况,进 行市场调研。
质量控制
卡方检验可以用于控制产品质量, 分析产品合格率、不良品率等, 确定生产工艺是否正确。
计算卡方值
2
计算观察频数和期望频数,并按照公式
计算卡方值。
3
查找P值
查找卡方分布表中的临界值,以确定P值
做出结论
4
的大小。
比较P值和显著水平的大小,根据结论做 出是否拒绝原假设的决策。
卡方检验的结果解释
P值的大小
P值越小,代表观察到的数据 和期望值的差异越显著。
自由度的影响
自由度代表了数据可以变化 的自由度,自由度越大,得 到显著差异的概率越小。
卡方值的含义
卡方值越大,代表观察到的 数据和期望值之间的差异越 大,量
样本量过小可能导致卡方值不准 确,无法判断相关性。
适用范围
卡方检验只能用于分析分类变量 的相关性,无法用于连续变量。
误判率
卡方检验只能用于分析相关性, 无法保证因果关系。
结论和要点
医学统计学11卡方检验
卡方检验是医学统计学中一项非常重要的方法,它可以检验两个或多个分类 变量是否有显著差异。
卡方检验的基础知识
分类变量
卡方检验只能用于检验分类 变量,即变量取值范围为有 限个不同的类别,如血型、 肿瘤分期等。
原假设和备择假设
原假设是指我们要检验的假 设,而备择假设则是对原假 设的一个补充或对立的假设。
研究生医学统计学 卡方检验 PPT课件.ppt
431 388 495 137 1451
490 410 587 179 1666
902 800 950 32 2684
合计
1823 1598 2032 348 5801
H0:两种血型系统间无关联 H1:两种血型系统间有关联
=0.05
2 5801( 4312 490 2 ... 322 1) 213 .16
(A T )2 T
,
行数-1列数 1
2 (99 90.48)2 (5 13.52)2 (75 83.52)2 (2112.48)2 12.86
90.48
13.52
83.52
12.48
(2 1)(2 1) 1
以 1 查 2界值表得P<0.005。按 0.05水准,
拒绝H0,接受H1,可以认为两组降低颅内压的总体有效率不等,即 可认为异梨醇口服液降低颅内压的有效率高于氢氯噻泰+地塞米松 的有效率。
程度太差,不宜用2检验,而应改用确
切概率法。
四格表资料2检验的校正公式
2 C
( A T 0.5) 2 T
2 C
( ad bc n / 2)2 n (a b)(c d )(a c)(b d )
例 7-2 某医师欲比较胞磷胆碱与神经节甘酯治疗脑血管疾病的疗效, 将78例脑血管疾病患者随机分为两组,结果见表7-2。问两种药物治 疗脑血管疾病的有效率是否相等?
组别
阳性
预防注射组 4
非预防组 5(3)
合计
9
阴性 18 6 24
合计 22 11 33
感染率(%) 18.18 45.45 27.27
本例n为33<40,且有一个格子的理论频数为3<5.
医学统计学6卡方检验
课件
17
x2检验
• 单个样本构成比的x2检验 • 独立样本四格表的x2检验 • 行×列的x2检验
• 配对设计分类资料的x2检验
• 多维分类资料的x2检验
课件 18
四格表的卡方检验,也是通过计算代表实 际频数A与理论频数T之间的吻合程度的卡 方值来进行检验的。 理论频数T采用两组的合并情况来计算。
课件
44
• 第4步:x2检验(3) • 选择单元 格按钮 • 在交叉表: 单元显示 对话框: 勾上观察 值、期望 值、百分 比:行
课件
14
• 第4步:x2检验 • 选择分析→非参数检验→ 卡方 • 中医证型→检验变量列表
课件
15
• 第5步:结果解读
• 结果解读: x2=392.514, p=0.000,说明 原发性高血压患 者中医证型内部 构成不相同。
课件
16
注意事项
进行拟合优度 x2 检验,一般要求有足够的 样本含量,理论频数不小于 5 。 理论频数小于 5 时,需要合并计算。
课件
4
x2检验
• 单个样本构成比的x2检验——拟合优度检验
• 独立样本四格表的x2检验
• 行×列的x2检验
• 配对设计分类资料的x2检验 • 多维分类资料的x2检验
课件
5
x2检验
• 单个样本构成比的x2检验——拟合优度检验 • 独立样本四格表的x2检验
• 行×列的x2检验
• 配对设计分类资料的x2检验 • 多维分类资料的x2检验
课件
6• 在中医药科研中,经常 Nhomakorabea到同一个样本中 两个或多个构成比比较的问题,在满足卡 方检验的要求条件下,可用卡方检验来分 析实际频数的比率是否符合理论比率。
医学统计学 4、卡方检验
地区 Eskdale Annandale 合计
A型 33 54 87
B型 6 14 20
O型 56 52 108
AB 型 5 5 10
合计
100 125 225
Page
22
练习题(作业)
见word文档
Page
23
Page
24
Thank you!
25
Page 12
Page
13
结合此例,SPSS演示配对设计2检验
例2 设有132份食品标本,把每份标本一分为二,分 别用两种检验方法作沙门菌检验,检验结果如表2所 示,试比较两种检验方法的阳性结果是否有差别? 表2 两种检验方法检验结果比较
乙法 甲法 + 合计 + 80 31 111 10 11 21 合计 90 42 132
合计
假设检验步骤: (1)建立检验假设,确定检验水准
H0:B=C,即A、B两种方法的总体检出率相同
H1:B≠C,即A、B两种方法的总体检出率不同 α=0.05 (2)计算检验统计量2值
当 b+c≥40,
2
b c
bc
2
当 b+c<40,
2
b c 1
bc
2
例3 用三种不同治疗方法治疗慢性支气管炎的疗效 如表3所示,试比较三种治疗方法治疗慢性支气管炎 的疗效。 表3 三种不同治疗方法治疗慢性支气管炎的疗效
组别 A药 B药 C药 合计 有效 35 20 7 62 无效 5 10 25 40 合计 40 30 32 102
Page 19
(五)Fisher确切概率法
表1 两种药物治疗消化道溃疡4周后疗效
研究生医学统计学-X2检验
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
H
(1)检验 (1)检验 H 1 : π 1 ≠ π (2)用 (2)用 P =
n +1
0
:π1 = π
2 2
= π ( 分 别 为 样 本 率 P1、 P2 、 P 的 总 体 率 )
α = 0 .0 5
理论上应有: n 近似地代替 π ,理论上应有:
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
2011-12-15
本章内容
第一节 χ2分布和拟合优度检验 第二节 四格表资料的χ2检验 第三节 行×列(R×C)表资料的χ2检验 第四节 配对设计四格表资料的χ2检验 第五节 四格表资料的确切概率法
2011-12-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
第二节
表
2检验 四格表资料的χ
有效 无效 合 计 45 35 有效率 (%) (%) 91.1 68.6
两种疗法的心血管病病死率比较
药物
兰芩口服液 41(36.56) 4(8.44) 银黄口服液 24(28.44) 11(6.56)
合
计
65
15
80
81.3
2011-12-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
表
反应变量按二项分类的两个独立样本资料 反应结果 阳性 阴性 观察 总频数 阳性 频率
样本 1 样本 2 合计
A11
A21
A12
A22 n+2
n1+ ( 给 定 )
P = A11 n1+ 1
P2 = A21 n2+
统计学中的卡方检验
统计学中的卡方检验卡方检验是一种常用的统计学方法,用于判断两个或多个变量之间是否存在显著性差异。
本文将介绍卡方检验的原理、应用场景以及实际操作步骤。
一、卡方检验原理卡方检验基于观察数据与理论数据之间的差异来判断变量之间的相关性。
它通过计算卡方值来衡量观察值与理论值之间的偏离程度,进而判断差异是否具有统计学意义。
二、卡方检验的应用场景卡方检验广泛应用于以下几个方面:1. 样本观察与理论值比较:用于比较观察数据与理论数据之间的差异,例如检验一个硬币是否是公平的。
2. 不同群体之间的差异性:用于比较不同群体之间某一属性的差异,例如男性和女性在某一疾病患病率上是否存在显著性差异。
3. 假设检验:用于判断两个或多个变量之间是否存在显著性关联,例如是否存在两个变量之间的相关性。
三、卡方检验的基本思路卡方检验的基本思路是建立原假设和备择假设,通过计算卡方值和查表得到结果。
具体步骤如下:1. 建立假设:设立原假设H0和备择假设H1。
原假设通常假定两个变量之间不存在显著性关联,备择假设则相反。
2. 构建列联表:将观察数据按照行和列分别分类计数,得到列联表。
3. 计算期望频数:根据原假设计算每个单元格的期望频数,即在假设成立的条件下,各个单元格的理论频数。
4. 计算卡方值:根据观察频数和期望频数计算卡方值,计算公式为Χ²=∑[(O-E)^2/E],其中O为观察频数,E为期望频数。
5. 查找临界值:根据自由度和显著性水平,在卡方分布表中找到对应的临界值。
6. 判断结果:比较计算得到的卡方值与临界值,若卡方值大于临界值,则拒绝原假设,认为差异具有统计学意义。
四、卡方检验的实例分析假设我们想要研究吸烟和肺癌之间的关系,我们收集了300人的数据,包括是否吸烟和是否患有肺癌的情况。
观察数据如下:吸烟非吸烟总计患有肺癌 80 40 120未患肺癌 100 80 180总计 180 120 300根据这些数据,我们想要判断吸烟与肺癌之间是否存在显著性关联。
医学统计学卡方检验
03 左侧概率为P =P1+ P2 + P3 =0.316 , 右侧概率为P =P3+ P4 + P5 + P6 =0.929,故单侧检验P值为0.316。
Part 02.
配对四格表资料的 检验
χ2
概述
计数资料的配对设计常用于两种检验方 法、培养方法、诊断方法的比较。 特点是对样本中各观察单位分别用两种 方法处理,然后观察两种处理方法的某 两分类变量的计数结果,整理为
的条件下,利用超几何分布
Fisher确切概率法的基本思想
(hypergeometric distribution)公式直接计算 表内四个格子数据的各种组合 的概率,然后计算单侧或双侧
“!”为阶乘符号, n !=1×2×…×n,0 !=1, ∑Pi=1。
累计概率,并与检验水准比较,
P( ab)( c 作! 出 a 是! 否db 拒! ) 绝cH! ( 0a d 的! ! 结 论n! 。c)( b!d)!
当T<1或n<40,四格表资料χ2检验结果 可能会有偏性,需采用Fisher确切检验 进行分析。该法由R. A. Fisher提出,且 直接计算概率,因此也叫Fisher确切概 率检验(Fisher’s exact probability test)。
四格表资料的Fisher确切概率法
在四格表周边合计数固定不变
否有差别?
⑴设H0 :π1=π2 ,即两药有效率相同;H1 : π1≠π2 α=0.05
⑵n>40,Tmin>5
2 5 5 2 . 1 7 2 8 1 1 9 . 8 3 2 2 3 3 9 . 8 3 2 2 3 8 . 1 2 8 6 . 48 5 . 1 7 81 . 8 3 23 . 8 3 28 . 18
研究生医学统计学-X2检验课件
01
这是为了保证X2统计量的分布接近卡方分布。
每个单元格中的期望数都应该大于5
02
这是为了确保卡方分布的精确性和稳定性。
观察数和期பைடு நூலகம்数之间没有关联
03
这是为了确保X2统计量不受其他因素的影响。
限制条件
1 2
样本量较小
如果样本量较小,X2检验的准确性可能会受到影 响。
分类变量之间存在高度相关性
如果分类变量之间存在高度相关性,X2检验的结 果可能会受到干扰。
X2统计量的解读
X2值的大小表示分类变量之间关系的强度,X2值越大,说明分类变量之 间的关系越强。
X2检验的临界值一般为3.841、6.635等,当X2值大于临界值时,可以认 为分类变量之间存在显著关系。
在解读X2值时,需要考虑样本量和数据分布情况,对于小样本和极端数据 需要进行特殊处理。
X2统计量的优缺点
研究生医学统计学-x2检验课件
目录
CONTENTS
• X2检验的基本概念 • X2检验的假设与限制 • X2检验的统计量与解读 • X2检验的实际应用 • X2检验的软件实现 • X2检验的案例分析
01 X2检验的基本概念
CHAPTER
X2检验的定义
X2检验是一种用于检验分类变量间独 立性的统计方法,也称为卡方检验。 它通过比较实际观测频数与期望频数 之间的差异,来判断变量间的关联性。
谢谢
THANKS
总结词
探讨X2检验在医学研究中如何应用
详细描述
在医学研究中,X2检验常用于分析分类变量之间的关系,如疾病与基因型、治疗方式与疗效等。通过 X2检验,可以判断不同组别之间是否存在显著差异,从而为医学研究提供科学依据。
“医学统计课件-卡方检验”
卡方检验中的显著性水平和p 值
显著性水平和p值是判断卡方检验结果是否显著的重要指标。我们将解释它们 的概念和计算方法,并讨论常用的显著性水平选择。
卡方检验的优缺点
卡方检验是一种简单有效的统计方法,但也有其局限性。我们将讨论卡方检 验的优点和不足之处,以及与其他统计方法的比较。
单样本卡方检验的原理和步骤
单样本卡方检验用于比较一个分类变量的观察频数与期望频数之间的差异。 我们将介绍其原理、计算方法和实际操作步骤。
独立性卡方检验的原理和步骤
独立性卡方检验用于判断两个分类变量之间是否存在相关性。我们将详细解 释它的原理、计算方法,并提供一个实际案例进行分析。
适合度卡方检验的原理和步骤
卡方检验的实际应用案例
通过实际案例,我们将展示卡方检验在医学和流行病学研究中的应用。这些 案例将帮助您更好地理解卡方检件——卡方 检验”
卡方检验是一种常用的统计方法,用于比较两个或多个分类变量之间的差异。 本课件将详细介绍卡方检验的原理、步骤、应用和优缺点,以及在医学研究 和流行病学中的实际案例。
卡方检验的分类及适用范围
卡方检验可以分为单样本卡方检验、独立性卡方检验和适合度卡方检验。每 种检验方法适用的情况略有不同,我们将详细探讨它们的应用领域和限制。
医学统计学课件卡方检验
队列研究中的卡方检验
总结词
在队列研究中,卡方检验用于比较不同暴露 水平或不同分组在某个分类变量上的分布差 异,以评估暴露因素与疾病发生之间的关系 。
详细描述
队列研究是一种前瞻性研究方法,按照暴露 因素的不同将参与者分为不同的组,追踪各 组的疾病发生情况。通过卡方检验,可以比 较不同暴露水平或不同分组在分类变量上的 分布差异,如分析不同饮食习惯的人群中患
卡方检验与相关性分析的区别
卡方检验主要用于比较实际观测频数与期望频数之间的差异,而相关性分析则用于研究 两个或多个变量之间的关联程度。
卡方检验与相关性分析的联系
在某些情况下,卡方检验的结果可以为相关性分析提供参考,帮助了解变量之间的关联 程度。
05
卡方检验的应用实例
病例对照研究中的卡方检验
总结词
02
公式
卡方检验的公式为 $chi^{2} = sum frac{(O_{ij} - E_{ij})^{2}}{E_{ij}}$,
其中 $O_{ij}$ 表示实际观测频数,$E_{ij}$ 表示期望频数。
03
适用范围
卡方检验适用于两个分类变量的比较,可以用于分析病例对照研究、队
列研究等类型的研究。
卡方检验的用途
如比较不同年龄组、性别组等人群中某种疾病的患病率。
卡方检验的基本假设
每个单元格中的期望 频数应该大于5。
卡方检验对于样本量 较小的情况可能不适 用。
观察频数与期望频数 应该服从相同的概率 分布。
02
卡方检验的步骤
收集数据
01
02
03
确定研究目的
在开始卡方检验之前,需 要明确研究的目的和假设 ,以便有针对性地收集数 据。
【医学】《医学统计学》6 Chisquare test
它通过比较两个分类变量之间的 关系,推断它们之间是否存在关 联性。
卡方检验的重要性
01
在医学研究中,卡方检验常用于分析病例对照研究、队列研究等类型 的数据,以评估不同特征或因素之间的关联性。
02
卡方检验能够提供定量的证据,帮助研究者判断变量之间的关系是否 具有统计学显著性,从而为进一步的研究提供依据。
实施步骤
根据研究目的和数据特征,选择适当的 卡方检验方法,如四格表卡方检验、配 对卡方检验等。
VS
结果解读
根据卡方检验的结果,判断不同因素与疾 病发生之间的关系是否具有统计学显著性 。同时,结合实际情境和专业知识,对结 果进行合理的解释和推断。
07
结论与展望
卡方检验在医学统计学中的地位
重要统计工具
数据收集
首先,收集所有需要的数据,确保数据的准确性和完 整性。
数据筛选
检查数据中是否存在异常值或缺失值,这些值可能影 响检验结果。
数据分类
将连续变量转换为适当的分类变量,以便进行卡方检 验。
构建期望频数
理论频数计算
根据每个类别的预期频率计算期望频 数。
期望频数的调整
根据实际频数的大小对期望频数进行 调整,以避免极端值的影响。
卡方分布的应用
利用卡方分布表来确定显著性水平,判断实际频数与期望频数的差异是否具有 统计学上的意义。
确定显著性水平
选择显著性水平
选择合适的显著性水平(如0.05或 0.01),用于判断实际频数与期望频 数的差异是否具有统计学上的显著性 。
结果解释
根据卡方检验的结果,解释实际频数 与期望频数的差异是否具有统计学上 的显著性,并据此得出相应的结论。
卡方检验的应用场景
(医统)卡方检验
2
观测值的自由度(vi>2),Si为第i组观测值的标 准差 2 • 拒绝原假设的条件为: 2 ,
F检验
• 检验两组观测值的方差的齐性 • 原假设: 2 2
1 2
• 检验统计量:
2 2 2 S1 F 2 2 ~ F( 1 , 2 ) 1 S2
• 拒绝条件: F F /2 (1, 2 )或F F1 /2 (1, 2 )
2.拟合优度检验
• B.表征实验分布,即用卡方统计量检验实验分布 是否服从某一理论分布(正态、二项等) • 步骤:1.将总体X的取值范围分成k个互不重迭的 小区间 • 2.计算落入第i个小区间的样本值的观测频数 • 3. 根据所假设的理论分布, 算出总体X的值落入每 个小区间的概率p,于是np就是落入该区间的样本 值的理论频数 • 4.计算卡方统计量 • 5.与临界值进行比较,进行决策
χ2 检验 数据资料 总体 检验对象
离散型资料 总体分布是未知的
连续型资料假设检验
连续型资料 正态分布 对总体参数或几个总体 参数之差
不是对总体参数的检 验,而是对总体分布 的假设检验
三、χ2 检验的用途
适合性检验
是指对样本的理论数先通过一定的理
论分布推算出来,然后用实际观测值与理论
数相比较,从而得出实际观测值与理论数之
理论值(E)
696.75 232.25 929
O-E
+8.25 -8.25 0
由于差数之和正负相消,并不能反映实 际观测值与理论值相差的大小。
为了避免正、负相抵消的问题,可将实际 观测值与理论值的差数平方后再相加,也就是 计算:
∑(O-E)2
O--实际观察的频数 E--无效假设下的期望频数
卡方检验-研究生
52 34 表中 45 50 为基本数据,称为实际频数,用AR.C表示,
表中 46.09 39.91 是根据A计算得到的,称为理论频数, 50.91 44.09 用TR.C表示。该资料称为四格表资料。
若假设两种疗法治疗前列腺癌病人的3年生存率相同,即
H0: 1=2= 53.59%,则 T1.1=86×97/181=46.09 T1.2=86×84/181=39.91 T2.1=95×97/181=50.91 T2.2=95×84/181=44.09
一致性好 一致性较好
一致性差
例7~3 某实验室分别用乳胶凝集法和免疫荧光法对 58名可疑系统红斑狼疮患者血清中抗体进行测定, 结果见表7~3。问两种方法的检验结果有无差别?
表7~3 两种方法的检测结果
免疫荧光法
乳胶凝集法
+
—
+ — 合计
11(a) 2 (c)
13
12(b) 3(d)
45
合计
23 35 58
H0: π1=π2 即两种疗法治疗前列腺癌的3年生存率相同 H1: π1≠π2 即两种疗法治疗前列腺癌的3年生存率不相同
α=0.05
T1.1=86×97/181=46.09
T1.2=86×84/181=39.91
T2.1=95×97/181=50.91
T2.2=95×84/181=44.09
χ2 =∑(A-TT)2 =(52-4466..0099)2+(34-3399..9911)2+(45-5500.9.19)12+(50-4444..0099)2=3.11
甲方法
+ — 合计
表: 两种方法的检测结果
乙方法
+
【基础医学】第九章卡方检验
多看,多听,让你的头脑保持活跃。活到老,学到老。
人生成功第2课
令自己感到沮丧的秘诀就是用空闲 时间去烦恼自己是否快乐。所以不要费 事去想它!摩拳擦掌干起来吧。你将热 血沸腾,你会头脑清醒。很快,在你身 体中的这种高涨的积极人生观将把烦恼 从你的头脑中赶出去。
行动起来,忙碌起来。这是世界上 最便宜的一种药,也是最好的一种。
一个人永远也无法预料未来,所以不要延缓想过的生 活,不要吝于表达心中的话, 因为生命只在一瞬间。
人生太短,聪明太晚(5)
记住! 给活人送一朵鲜花,强过给死人送贵重的花圈
,每个人的生命都有尽头,许多人经常在生命 即将结束时,才发现自己还有很多事没有做, 有许多话来不及说,这实在是人生最大的遗憾 。 别让自己徒留「为时已晚」的空余恨。逝者不 可追,来者犹未卜,最珍贵、最需要实时掌握 的「当下」,往往在这两者蹉跎间,转眼错失 。
第二节R×C表2检验
凡反应变量为频数的资料,均可通过列表 形式表达,因为其基本数据有R行C列,故 通称行×列表或列联表(contingency table),简称R×C表。前述四格表,即 2×2表,是最简单的一种R×C表形式。 R×C表有多种资料形式,如多个样本率的 比较(如例9-4),两组百分比的比较(如 例9-5),多组百分比的比较(如例9-6) ,等等。
人生太短,聪明太晚(7)
一句瑞典格言说:「我们老得太快,却 聪明得太迟。」 不管你是否察觉,生命 都一直在前进。
人生并未售来回票,失去的便永远不再 得到。
将希望寄予「等到方便的时间才享受」
人生太短,聪明太晚(8)
我们不知失去了多少可能的幸福 不要再等待有一天你「可以松口气」,或是「麻烦都
过去了」。 生命中大部分的美好事物都是短暂易逝的, 享受它们、品尝它们, 善待你周围的每一个人, 别把时间浪费在等待所有难题的「完满结局」上。 找回迷失的生命 死亡也许是免费的 ─ 但是,却要付出生命的代价。 劝大家一句话:把握当下,莫等待。
医学统计学 卡方、秩和(研)
合计 n1• n2• … n s• n
这里,将每一行都视为一个总体,于是,每个总 体都有一个构成比: Aij/ni. 。我们要比较的是各总 体的构成比是否相同。即 H0:各总体的构成比相同,都为合并的构成比: n • j/n
于是可用Pearson的卡方统计量来对H0进行检验。
2 A ij 2 n 1 Tij n n i j (r 1)(c 1) r为行数,c为列数
2
2.配对四格表资料的χ2检验 计数资料配对设计的特点是:将一份标本分为2份,分 别用两种方法进行处理,然后将二分类的处理结果用下表 形式表示出来。
甲法
+ - 合计
乙法 + - a b c d a+c b+d
合计
a+b c+d n
这里要比较的是两种方法的检测结果是否一 致?通过观察,发现a、d反映的是两种方法的一致 性,而b、c反映的是两种方法的差异,故只需考虑 b、c即可。
2
( Aij Tij ) Tij
98 124 98 76 80 18 200 200 98 124 98 76 200 200 (3 1)(2 1) 2
2
2
62 76 38 200 32.75 62 76 200
χ2检验
χ2检验是英国统计学家Pearson提出的一种以χ2 分布为理论基础,用途非常广泛的假设检验方法。 下面介绍常用的几种χ2检验方法。
1.四格表资料的χ2检验
先看一个例子:某医生用A、B两种药物治疗急性下 呼吸道感染,A药治疗74例,有效68例, B药治疗63 例,有效52例,结果见下表。问两种药的有效率是否 有差别? 处理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计研究所获得的资料为计数资料进行比较。
配对设计包括:
①同一批样品用两种不同的处理方法
②观察对象根据配对条件配成对子,同一对子
内的不同个体分别接受不同的处理
③在病因或危险因素的研究中,将病人和对照
按配对条件配成对子,研究是否存在某种病因
或危险因素。
观察的结果只有阳性、阴性两种可能,清点 成对资料时只有四种情况: a:甲+乙+ b:甲+乙c:甲-乙+ d:甲-乙列成下面四格表
例 对120名确诊的乳腺癌病人,分别用甲乙
两种方法来检测,甲方法检出阳性率为60%, 乙方法检出阳性率为50%,甲乙一致检出阳 性率为35%,问甲乙两方法检出阳性率有无 差别?
表: 两种方法的检测结果 甲方法 乙方法 + — 42(a) 30(b) 18(c) 30(d) 60 (a+c) 60(b+d) 合 计
T=
46.09 +
υ=(2-1) (2-1)=1 查χ2界值表得 χ20.05,1=3.84, χ2< χ20.05,1, P>0.05。按α=0.05的水准,不 拒绝H0,还不能认为两种疗法治疗前列腺癌的3年生存率不相同。
(二)、四格表的专用公式
当n≥40,T≥5时,用
χ2 =
(ad-bc)2 n (a+b)(c+d)(a+c)(b+d) 为四格表的实际频数
判断结果,根据自由度υ的大小查χ2界值表 当χ2≥ χ2α,υ时,P≤α,拒绝H0,接受H1 当χ2< χ2α,υ时,P>α ,不拒绝H0. χ2反映了实际频数与理论频数的吻合程度
2 二、一般四格表的χ 检验
(一)、四格表的一般公式
χ2
T υ = (R-1)(C-1)
=∑
(A-T)2
以例10-7为例做χ2检验 H0: π1=π2 即两种疗法治疗前列腺癌的3年生存率相同 H1: π1≠π2 即两种疗法治疗前列腺癌的3年生存率不相同
a、b、c、d
(a+b), (c+d), (a+c), (b+d)是四格表周边的合计数
n=a+b+c+d, 为总的样本含量 对例10-7的计算
2 (52 × 50-34 × 45) 181 2 χ = =3.11 (86×95×97×84) 显然,计算结果与前相同,但该法避免了计算理论数的麻繁
(三)、四格表的校正公式 1.χ2检验的应用条件 (1)当n≥40且T≥5时,用χ2检验的基本公式或四格表的专用
nR×nc
n
χ2
T υ = (R-1)(C-1)
υ = (2-1)(2-1)=1
=∑
(A-T)2
假如H0: π1= π2成立,则A、T不会相差太大,那么χ2 会小;(A与T的差别是由抽样误差所致) 反之若检验假设H0不成立, 则A、T会相差很大,那 么χ2会大;(抽样误差不能引起A与T如此大的差别)
例7-2某医师用两种疗法治疗心绞痛,结果如表 10-10,
问两种疗法的疗效有无差别?
表10-10 两种疗法治疗心绞痛的效果率
组 别 有效 无效 合计 有效率(%)
甲疗法 乙疗法 合 计
23 27 50
6 (4.42) 3 9
29 30 59
79.31 90.00 84.75
H0: H1:
π1= π2 即两种疗法的疗效相等 π1≠ π2 即两种疗法的疗效不等
适用于配对设计的计数资料
配对资料的结果有 甲 + + - - 乙 + - + - 结果 a b c d 配对设计的计数资料 乙法 合 计 甲法 + - + a b a+b - c d c+d 合计 a+c b+d n
χ2 =(b-c)2/(b+c),
υ=1, (b+c) ≥40
χc2 = ( b-c -1)2/(b+c), υ=1 (b+c) <40
公式;当P≈α时,改用四格表的确切概率法。
(2)当n≥40时但有1≤T<5时,用四格表χ2的校正公式或用
四格表的确切概率法
(3)当n<40时,或T<1时,用四格表的确切概率法 2.四格表χ2的校正公式
χ2 =∑
(︱A-T︱-0.5)2
T
χ2
=
(︱ad-bc︱-n/2)2 n (a+b)(c+d)(a+c)(b+d)
α=0.05 T=29×9/59=4.42(计算行合计和列合计均为最小的理论数) χc2 =
( 23×3-6×27 -59/2)2×59 29×30×50×9 =0.61
υ=1,查χ2界值表得, P>0.05。按α=0.05的水准不拒绝 H0,
尚不能认为两种两种疗法的疗效不等.
三、配对四格表资料的χ2检验
2 χ
检验
(Chi-square test) (3学时)
吴成秋 公共卫生学院卫生统计学教研室
χ2检验的应用
1.推断两个(多个)总体率或构成比之间是否有差别
2.多个样本率间的多重比较 3.两个分类变量之间有无关联性 4.频数分布拟合优度检验
一、χ2检验的基本思想
例7-1 某医生用两种疗法治疗前列腺癌,出院后
随访3年,甲疗法治疗86例。乙疗法治疗95例,
结果见下表。问两种疗法治疗前列腺癌病人的3
年生存率是否有差别?
表10-7
处 理 甲疗法 乙疗法 合 计
甲乙两种疗法治疗前列腺癌的3年生存率
生存数 a52(46.09) c45(50.91) 死亡数 b34(39.91) d50(44.09) (b+d) 84 合 计 生存率(%) 60.47 47.37 53.59 (a+b)86 (c+d)95 (n)181
(a+c)97
表中
52 34 为基本数据,称为实际频数,用AR.C表示, 45 50
46.09 39.91 50.91 44.09 是根据A计算得到的,称为理论频数, 用TR.C表示。该资料称为四格表资料。
表中
若假设两种疗法治疗前列腺癌病人的3年生存率相同,即
H0: 1=2= 53.59%,则 T1.1=86×97/181=46.09 T1.2=86×84/181=39.91 T2.1=95×97/181=50.91 T2.2=95×84/181=44.09 TR.C =
α=0.05
T1.1=86×97/181=46.09 T2.1=95×97/181=50.91 T1.2=86×84/181=39.91 T2.2=95×84/181=44.09 39.91 + 50.91 + 44.09 =3.11
χ2
=∑Leabharlann (A-T)2 (52-46.09)2 (34-39.91)2 (45-50.91)2 (50-44.09)2