医学统计学孙振球第七章卡方检验

合集下载

【卫生统计学-资料】_医学统计学课件--第七章_卡方检验

n R nC N
式中符号含义：
A：实际频数，表中实际发生的阳性或阴性频数
T：理论频数，按某H0假设计算理论上的阳性或阴性频数
表7-1两组疗法降低颅内压有效率(%)
疗法有效人数无效人数合计有效率
试验组 99(90.48) 5(13.52) 104 95.2
对照组 75(83.52) 21(12.48) 96 78.1
无效数合计有效率%
5(A12) 104
21(A22) 96
26
200
95.20 78.13 87.00
问：两组有效率差别是否是抽样误差或是不同药
物的作用？
组别 +
—
四格表
甲 99 5
的数字
乙 75 21
Pearson 2 检验的基本公式
（公式7-1)
2 (AT)2
T
(公式7-3）
T RC
Expected=T
90.48 13.52 83.52 12.48
2 (A T )2
T
T=n ×π
2 (9990.48)2 (513.52)2 (7583.52)2 (2112.48)2 12.86
90.48
13.52
83.52
12.48
TRC
nR nC N
T11
104 174 200
表 100例高血压患者治疗后临床记录
编号
1 2 3 4
年龄 X1
37 45 43 59
性别治疗组舒张压体温
X2 X3 X4 X5
男 A 11.27 37.5 女 B 12.53 37.0 男 A 10.93 36.5 女 B 14.67 37.8

医学统计学课件-卡方检验

联合治疗 39 34.44 8 12.56 47 73.3 单纯治疗 57 61.56 27 22.44 84 73.3
合计
96
35
131 73.3
Trc
nr nc n
理论频数＝ 84 73.3%
χ2检验的基本思想(1)
通过构造A与T吻合程度的统计量来反映两样本率的差别!
实际数A
39
8
57
27
污染率 (%)
甲
6
23
29
79.3
乙
30
14
44
31.8
丙
8
3
11
27.3
合计
44
40
84
47.6
理论数的计算
实际数A
6
23
29
30
14
44
8
3
11
44
40
84
(52.4%) (47.6%)
理论数T
15.2 13.8
23.0 21.0
5.8
5.2
T
nR
nC N
nR nC N
2值的计算
实际数A
χ2检验相关问题－应用条件
某矿石粉厂当生产一种矿石粉石时，在数天内即有部分工人患职业性皮肤炎，在生产季节开始，随机抽取15名车间工人穿上新防护服，其余仍穿原用的防护服，生产进行一个月后，检查两组工人的皮肤炎患病率，结果如表，问两组工人的皮肤炎患病率有无差别？
χ2检验相关问题－应用条件
Total
When the variables are independent, the proportion in
both groups is close to the same size as the proportion

医学统计学孙振球(第三版)SAS程序及结果

means a b c a*b a*c b*c; run; 4.卡方检验 input r c f @@; cards; proc freq; weight f; tables r*c/chisq expected; run; H0：π 1=π 2 H1：π 1>π 2， P右侧 H1：π 1<π 2，P左侧 Frequency频数 Expected期望值 Percent百分比 Row Pct行百分比 Col Pct列百分比 Chi-Square卡方 Likelihood Ratio Chi-Square似然比卡方 Continuity Adj. Chi-Square连续校正卡方 Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient列联系数 Cramer's V n≥40，且所有T≥5，用Chi-Square 1≤T<5，用Continuity Adj. Chi-Square n<40，或T<1用 Fisher's Exact Test χ2、χc2计算的P值与α很接近，改用Fisher's 2）配对四格表 H0：b=c H1：b≠c proc freq; weight f; tables r*c/agree; run; McNemar's Test Statistic (S) Pr > S 一致性检验kappa值为0-0.4差 0.4-0.75一般0.75-1好 b+c≥40，用Chi-Square b+c <40 ，用 Continuity Adj. Chi-Square H1：π 1<π 2，P左侧 R*C列表资料 proc freq; tables r*c/chisq cmh exact nopercent nocol norow expected; weight f; run; 结果:Cochran-Mantel-Haenszel Statistics Nonzero Correlation双向有序 Row Mean Scores Differ列有序 General Association双向无序分层χ2 input hospital trt effect f; cards; proc freq order=data; tables

医学统计学(6) 卡方检验

•进一步的两两比较
•P<0.017才有统计学意义！！
【例6】某中医院用三种治疗方法治疗413例糖尿病患者，资料见表。为避免中医不同证型对疗效比较的影响，分析3种疗法治疗的病人按3种中医分型的构成比有无差别？
SPSS软件操作
• 第1步：定义变量
• 第2步：输入原始数据
• 第3步：定义频数 • 选择数据→加权个案 • 频数→加权个案（频数变量）
CMH多维卡方检验
• 第4步：x2检验（2） • 选择统计量按钮 • 在交叉表：统计量对话框：勾上卡方
• 第4步：x2检验（3） • 选择单元格按钮 • 在交叉表：单元显示对话框：勾上观察值、百分比：行、列
• 第5步：结果解读（1）
• 结果解读：中西医组的治愈率为98.2%，西医组的治愈率为74.0%。
【例4】某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果，将33例HBsAg阳性孕妇随机分为预防注射组和非预防组，结果见表。问两组新生儿的HBV总体感染率有无差别？
• 第1步：定义变量
SPSS软件操作
• 第2步：输入原始数据
• 第3步：定义频数 • 选择数据→加权个案 • 频数→加权个案（频数变量）
医学统计学（6 ）
《中华医学杂志》对来稿统计学处理的有关要求
卡方检验(chi-square test)
• χ2检验是现代统计学的创始人之一，英国人 Karl . Pearson于1900年提出的一种具有广泛用途的统计方法。 • 可用于两个或多个率间的比较，计数资料的关联度分析，拟合优度检验等等。
关联性分析
列联系数的意义 • |rp|<0.4，关联程度低 • 0.4≤|rp|<0.7，关联程度中等 • |rp|≥0.7，关联程度高

《医学统计概论》第7章卡方检验Chi-square test

(2) 当n≥40，有任一格1≤T＜5时，可用Yates校正公式；
(3) 当n＜40或有T＜1时，用Fisher’s exact probability。
7.2 配对四格表资料的χ2检验
配对设计包括：（1）同一批样品用两种不同的处理方法；（2）观察对象根据配对条件配成对子，同一对子内不同的个体分别接受不同的处理；（3）在病因和危险因素的研究中，将病人和对照按配对条件配成对子，研究是否存在某种病因或危险因素。
表7-1 两组降低颅内压有效率的比较（P137）
组别
试验组对照组合计
有效
99 75 174
无效
5 21 26
合计
104 96 200
有效率(%)
95.20 (p1) 78.13 (p2) 87.00 (pc)
实际频数A (actual frequency) 理论频数T (theoretical frequency)
,
1
因为有一格1＜T＜5，且n＞40时，所以应用连续性校
正χ2检验。
四、精确概率法(Fisher’s exact probability)
在无效假设成立的前提下且周边合计固定时，产生任意一个四格表(i)的概率Pi 服从于超几何分布，其计算式为：
a b!c d !a c!b d !
Pi
a!b!c!d !n!
药物治疗组 164
18
182
外用膏药组 118
26
144
4.59
>0.0125 (NS)
合计
282
44
326
二、各实验组与同一对照组比关键是检验水平的校正
'
2k 1
自学
7.6 双向有序分组资料的线性趋势检验

医学统计学：第七章卡方检验

c2 检验是以c2 分布为理论依据，用途广泛用途的统计方法。
c(chi)为希腊字母，音为 kai。
2021/5/11
第七章卡方检验
5
c2检验
c2 检验的用途（1）用于推断个总体率或构成比之间有无差别；（2）推断多个总体或构成比之间有无差别；（3）多个样本率比较的Χ2 分割；（4）两个分类变量间有无关联性；（5）频数分布的拟合优度检验。
某院欲比较异梨醇口服液（试验组）和氢氯噻嗪+地塞米松（对照组）降低颅内压的疗效。将200例颅内压增高症患者随机分为两组，结果见表7-1。
问两组降低颅内压的总体有效率有无差别？
红框内的资料(99、5、75、21)称为四格表(fourfold table)资料。
表7-1 两组降低颅内压有效率的比较
组别
2021/5/11
第七章卡方检验
第一节四格表资料 19
四格表c2检验专用公式
四格表c2检验专用公式：
用a、b、c、d表示四格表资料的4个实际频数。
c2
(ad bc)2 n
(a b)(c d )(a c)(b d )
91 21 5 752 200
12.86
104 96174 26
第四节行×列表的c2检验第五节多个样本率比较的c2分割法
四、双向无序分类资料的独立性检验五、双向有序分类资料的线性趋势检验
第六节有序分组资料的线性趋势检验
六、双向分类(属性相同)资料的一致性检验
第二节配对四格表资料的c2检验
七、第七节频数分布拟合优度c2检验大纲练习题资料类型与c2检验
2021/5/11
c2值的大小还取决于自由度n的大小。
自由度n愈大， c2值也会愈大。

医学统计学--卡方检验

பைடு நூலகம்
笃学
精业
修德
厚生
6
2 ( A T ) 2值的大小还取决于个数的多少（严 T 2 ( A T ) 格地说是自由度的大小）。由于各皆是 T 2
正值，故自由度愈大，值也会愈大；所以只 2 值才能正确地反映有考虑了自由度的影响，
实际频数 A和理论频数 T 的吻合程度。检验时，要根据自由度查 2 界值表。当 2≥ 2时， P , ,
2 中，若拒绝无效假设
H0只能做出总的结论，但还不知道哪两
个率之间有差别。若想知道哪两个率之间
有差别，还要进行两两比较，本节介绍两
两比较的方法之一：行×列表的分割。
笃学
精业
修德
厚生
30
4.行×列表的分割（一）多个实验组间的两两比较由于要做重复多次的假设检验，需对第Ⅰ 类错误作校正，新的校正检验水准为：
第七章掌握内容：
2 检验
1．检验的基本思想和用途 2．成组设计四格表资料检验的计算及应用条件
3．配对设计四格表资料检验 4．行列表资料检验及应用时应注意的问题 5．频数分布拟合优度的检验了解内容 1．四格表资料的Fisher精确概率法的基本思想与检验步骤
笃学精业修德厚生
2 检验是一种用途很广的假设检验方
处理组 1 2 属性阳性阴性合计
合计
a (T11) c (T21) m1
b (T12) d (T22) m2
n1(固定值) n2(固定值) n
要想知道处理组1，2之间差别是否有统计学意义，常用 2 检验统计量来作假设检验。
笃学精业修德厚生
5

【孙振球第三版】医学统计学复习题(名词解释和简答)

一、名词解释：1、总体：根据研究目的确定的同质观察单位的全体。

是同质所有观察单位的某种变量值的集合。

2、有限总体：是指空间、时间范围限制的总体。

3、无限总体：是指没有空间、时间限制的总体。

4、样本：从总体中随机抽取部分观察单位，其实测值的集合。

5、@计量资料：又称定量资料或数值变量资料。

为观测每个观察单位的某项指标的大小，而获得的资料。

其变量值是定量的，表现为数值大小，一般有度量衡单位。

根据其观测值取值是否连续，又可分为连续型或离散型两类。

6、计数资料：又称定性资料或者无序分类变量资料，亦称名义变量资料，是将观察单位按照某种属性或类别分组计数，分组汇总各组观察单位数后得到的资料。

其变量值是定性的，表现为互不相容的性或类别。

分两种情形：（1）二分类：两类间相互对立，互不相容。

（2）多分类：各类间互不相容。

7、等级资料：又称半定量资料或有序分类变量资料，是将观察单位按某种属性的不同程度分成等级后分组计数，分类汇总各组观察单位数后而得到的资料。

其变量值具有半定量性质，表现为等级大小或属性程度。

8、随机误差（偶然误差）：是一类不恒定的、随机变化的误差，由多种尚无法控制的因素引起，观察值不按方向性和系统性变化，在大量重复测量中，它可呈现或大或小，或正或负的规律性变化。

9、平均数：描述一组变量值的集中位置或水平。

常用的平均数有算术平均数、几何平均数和中位数。

10、抽样误差：由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异，以及统一总体若干样本统计量之间的差异。

11、I型错误：拒绝了实际上成立的H0，这类“弃真”错误称为I 型错误。

检验水平，就是预先规定的允许犯I型错误概率的最大值。

I型错误概率大小也用α表示，α可取单尾亦可取双尾。

12、II型错误：“接受”了实际上不成立的H0，这类“取伪”的错误称为II型错误。

其概率大小用β表示，β只取单尾，β值的大小一般未知，，须在知道两总体差值δ、α及n时，才能算出。

《医学统计学》习题解答(最佳选择题和简答题)

《医学统计学》习题解答（最佳选择题和简答题）孙振球主编.医学统计学习题解答. 第2版. 北京：人民卫生出版社2005目录第二章计量资料的统计描述 (2)第三章总体均数的估计与假设检验 (3)第四章多个样本均数比较的方差分析 (6)第五章计数资料的统计描述 (7)第六章二项分布与Poisson分布 (9)第七章χ2检验 (11)第八章秩和检验 (13)第九章回归与相关 (14)第十章统计表与统计图 (17)第十一章多因素试验资料的方差分析 (19)第十二章重复测量设计资料的方差分析 (19)第十五章多元线性回归分析 (20)第十六章logistic回归分析 (22)第十七章生存分析 (23)第二十五章医学科学研究设计概述 (26)第二十六章观察性研究设计 (26)第二十七章实验研究设计 (28)第二十七章临床试验研究设计 (29)第二章计量资料的统计描述（注：题号上有“方框” 的简答题为基本概念，下同）第三章总体均数的估计与假设检验简答题：第四章多个样本均数比较的方差分析简答题：第五章计数资料的统计描述简答题：第六章二项分布与Poisson分布简答题：第七章χ2检验简答题：1. 说明χ2检验的用途2. 两个样本率比较的u检验与χ2检验有何异同？3. 对于四格表资料，如何正确选用检验方法？4. 说明行×列表资料χ2检验应注意的事项？5. 说明R×C表的分类及其检验方法的选择。

第八章秩和检验简答题：5. 两独立样本比较的Wilcoxon秩和检验，当n1>10或n2-n1>10时用u检验，这时检验是属于参数检验还是非参数检验，为什么？6. 随机区组设计多个样本比较的Friedman M 检验，备择假设H1如何写？为什么？第九章回归与相关简答题：第十章统计表与统计图简答题：5. 统计表与统计图有何联系和区别？6. 茎叶图与频数分布图相比有何区别，有何优点？第十一章多因素试验资料的方差分析一、简答题1. 简述析因试验与正交试验的联系与区别。

医学统计学卡方检验

02 P =P1+ P2 + P3 + P6 =0.370 ＞ 0.05，不拒绝H0 。
03 左侧概率为P =P1+ P2 + P3 =0.316 ，右侧概率为P =P3+ P4 + P5 + P6 =0.929，故单侧检验P值为0.316。
Part 02.
配对四格表资料的检验
χ2
概述
计数资料的配对设计常用于两种检验方法、培养方法、诊断方法的比较。特点是对样本中各观察单位分别用两种方法处理，然后观察两种处理方法的某两分类变量的计数结果，整理为
的条件下，利用超几何分布
Fisher确切概率法的基本思想
（hypergeometric distribution）公式直接计算表内四个格子数据的各种组合的概率，然后计算单侧或双侧
“！”为阶乘符号， n !=1×2×…×n，0 !=1， ∑Pi=1。
累计概率，并与检验水准比较，
P( ab)( c 作! 出 a 是! 否db 拒! ) 绝cH! ( 0a d 的! ! 结论n! 。c)( b!d)!
当T<1或n<40，四格表资料χ2检验结果可能会有偏性，需采用Fisher确切检验进行分析。该法由R. A. Fisher提出，且直接计算概率，因此也叫Fisher确切概率检验（Fisher’s exact probability test）。
四格表资料的Fisher确切概率法
在四格表周边合计数固定不变
否有差别？
⑴设H0 ：π1=π2 ，即两药有效率相同；H1 ： π1≠π2 α=0.05
⑵n>40，Tmin>5
2 5 5 2 . 1 7 2 8 1 1 9 . 8 3 2 2 3 3 9 . 8 3 2 2 3 8 . 1 2 8 6 . 48 5 . 1 7 81 . 8 3 23 . 8 3 28 . 18

医学统计学第七章卡方检验

n 40 或 T 1，直接计算概率。
2 连续性校正仅用于的1 四格表资料，当
，一般不作校正。
时2
23
第二十三页，共100页
例7-2 某医师欲比较胞磷胆碱与神
经节苷酯治疗脑血管疾病的疗效，将78 例脑血管疾病患者随机分为两组，结果见表7-3。问两种药物治疗脑血管疾病的
有效率是否相等？
24
阳性阴性
4
18
5(3) 6
9
24
合计感染率（%）
22
18.18
11
45.45
33
27.27
39
第三十九页，共100页
一、基本思想
在四格表周边合计数固定不变的条件
下，计算表内4个实际频数变动时的各种
组合之概率；再Pi按检验假设用单侧或双侧的累计概率，依P据所取的检验
水准做出推断。
40
第四十页，共100页
b, c为两法观察结果不一致的两种情况。
检验统计量为
2 (b c)2 , 1
bc
2 c
( b c 1)2 bc
Байду номын сангаас
,
=1
33
第三十三页，共100页
注意：
本法一般用于样本含量不太大的资料。因为
它仅考虑了两法结果不一致的两种情况(b, c)，
而未考虑样本含量n和两法结果一致的两种情况
(a, d)。所以，当n很大且a与d的数值很大（即两
1．各组合概率Pi的计算在四格表周边合计数不变的条件下，表内4个实际频数 a,b,c,d 变动的组合数共有“周边合计中最小数+1”个。如例
7-4 ，表内 4 个实际频数变动的组合数共有 9+1=10个，依次为：

医学统计学课件卡方检验

队列研究中的卡方检验
总结词
在队列研究中，卡方检验用于比较不同暴露水平或不同分组在某个分类变量上的分布差异，以评估暴露因素与疾病发生之间的关系。
详细描述
队列研究是一种前瞻性研究方法，按照暴露因素的不同将参与者分为不同的组，追踪各组的疾病发生情况。通过卡方检验，可以比较不同暴露水平或不同分组在分类变量上的分布差异，如分析不同饮食习惯的人群中患
卡方检验与相关性分析的区别
卡方检验主要用于比较实际观测频数与期望频数之间的差异，而相关性分析则用于研究两个或多个变量之间的关联程度。
卡方检验与相关性分析的联系
在某些情况下，卡方检验的结果可以为相关性分析提供参考，帮助了解变量之间的关联程度。
05
卡方检验的应用实例
病例对照研究中的卡方检验
总结词
02
公式
卡方检验的公式为 $chi^{2} = sum frac{(O_{ij} - E_{ij})^{2}}{E_{ij}}$，
其中 $O_{ij}$ 表示实际观测频数，$E_{ij}$ 表示期望频数。
03
适用范围
卡方检验适用于两个分类变量的比较，可以用于分析病例对照研究、队
列研究等类型的研究。
卡方检验的用途
如比较不同年龄组、性别组等人群中某种疾病的患病率。
卡方检验的基本假设
每个单元格中的期望频数应该大于5。
卡方检验对于样本量较小的情况可能不适用。
观察频数与期望频数应该服从相同的概率分布。
02
卡方检验的步骤
收集数据
01
02
03
确定研究目的
在开始卡方检验之前，需要明确研究的目的和假设，以便有针对性地收集数据。

医学统计学--卡方检验

检验水准拒绝H
0，接受H
，可认为两总体率不
1
同；若
P0.05，按检验水准 0.05不拒绝 H
，
0
尚不能认为两总体率不同。
笃学
精业
修德
厚生
10
两样本率比较的资料，既可用 u检验
也可用 2 检验来推断两总体率是否有差别，且在不校正的条件下两种检验方法是等价的，
对同一份资料有
u2。 2
H1:两组工人皮肤炎总体患病率不等，即 1 2
0.05
校正 2 值为：
2 (|13.84|0.5)2 (|1411.16|0.5)2
3.84
11.16
(|107.16|0.5)2 (|1820.84|0.5)2
7.16
20.84
2.94
校正公式
2 c

(AT0.5)2 T
校正公式
c2=(a
(|ad-bn 2)c2n|+)b (c+)d(a+)(b c+)d
笃学
精业
修德
厚生
9
（3）当 n40，或 T 1时，不能用 2检验，
改用四格表资料的Fisher确切概率法。
3．作出统计结论
以=1查 2界值表，若 P0.05，按0.05
笃学
精业
修德
厚生
11
例为了解铅中毒病人是否有尿棕色素增加现象，分别对病人组和对照组的尿液作尿棕色素定性检查，结果见下表，问铅中毒病人与对照人群的尿棕色素阳性率差别有无统计学意义？
表两组人群尿棕色素阳性率比较
组别
铅中毒病人对照组
阳性数阴性数合计
(18.74) (17.26)

【医学统计学】第七章 X2检验

•表中不宜有1/5以上格子的理论频数小于5，或有一个格子的理论频数小于1。 •增加样本含量以增大理论数 •根据专业知识删减或合并 •计算确切概率
2021/3/18
青岛大学医学院公共卫生系流行病与卫生统计学教研室周晓彬制作
第四节配对设计四格表资料的χ2检验
两种培养基白喉杆菌生长情况
甲培养基
乙培养基
合计
＋
－
＋
22 (a)
18(b)
40
－
2 (c)
14(d)
16
合计
24
32
56
H0： B=C H1： BC =0.05。
2 (b c)2 , bc
1
2 (| b c | 1)2 ,
连续性校正：
bc
1
当 b+c40 时可不校正，而 b+c<40 时则一定要校正。
本例 b+c=18+2=20<40，需作连续性校正，
(18 2 1)2
2
11.25,
10 31
1
2021/3/18
青岛大学医学院公共卫生系流行病与卫生统计学教研室周晓彬制作
两种方法检查室壁收缩运动情况
甲法测定
乙法测定结果
结果
正常
减弱
异常
正常
60
3
2
减弱
0
42
9
异常
8
9
592 184 92
182 184 26
432 111 101
272 111 76
332 111 92
82 111 26
1
1.839

【医学】《医学统计学》6 Chisquare test

02
它通过比较两个分类变量之间的关系，推断它们之间是否存在关联性。
卡方检验的重要性
01
在医学研究中，卡方检验常用于分析病例对照研究、队列研究等类型的数据，以评估不同特征或因素之间的关联性。
02
卡方检验能够提供定量的证据，帮助研究者判断变量之间的关系是否具有统计学显著性，从而为进一步的研究提供依据。
实施步骤
根据研究目的和数据特征，选择适当的卡方检验方法，如四格表卡方检验、配对卡方检验等。
VS
结果解读
根据卡方检验的结果，判断不同因素与疾病发生之间的关系是否具有统计学显著性。同时，结合实际情境和专业知识，对结果进行合理的解释和推断。
07
结论与展望
卡方检验在医学统计学中的地位
重要统计工具
数据收集
首先，收集所有需要的数据，确保数据的准确性和完整性。
数据筛选
检查数据中是否存在异常值或缺失值，这些值可能影响检验结果。
数据分类
将连续变量转换为适当的分类变量，以便进行卡方检验。
构建期望频数
理论频数计算
根据每个类别的预期频率计算期望频数。
期望频数的调整
根据实际频数的大小对期望频数进行调整，以避免极端值的影响。
卡方分布的应用
利用卡方分布表来确定显著性水平，判断实际频数与期望频数的差异是否具有统计学上的意义。
确定显著性水平
选择显著性水平
选择合适的显著性水平（如0.05或 0.01），用于判断实际频数与期望频数的差异是否具有统计学上的显著性。
结果解释
根据卡方检验的结果，解释实际频数与期望频数的差异是否具有统计学上的显著性，并据此得出相应的结论。
卡方检验的应用场景

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

本例 n 78, 但T22 4.67，故用四格表 2 资料检验的校正公式

2 c
( 46 8 6 18 78 / 2) 78
2
52 26 64 14
3.14
1，查 2 界值表得 0.05 P 0.10 。按
0.05检验水准不拒绝 H 0，尚不能认为两种药物治疗脑血管疾病的有效率不等。
两法的一致率较高），b与c的数值相对较小时，即便是检验结果有统计学意义，其实际意义往
往也不大。
105
35
检验步骤： H 0 ： B C ， H 1 ： B C ， 0.05
b c 12 2 14 40 ，用校正公式
c2
( 12 2 1) 2 12 2
检验的自由度取决于可以自由取值的格
2
子数目，而不是样本含量n。四格表资料只有两行两列，=1，即在周边合计数固定的情况下，4个基本数据当中只有一个可以自由取值。 105 17
3. 假设检验步骤
（1）建立检验假设，确定检验水平。
H0:π1=π2 即试验组与对照组降低颅内压的总体有效率相等 H1:π1≠π2 即试验组与对照组降低颅内压的总体有效率不相等
(2 1)( 2 1) 1
105 19
以 =1 查附表 8 的界值表得
2
P 0.005 。按 0.05 检验水准拒绝 H 0 ，
接受 H 1 ，可以认为两组降低颅内压总体有效率不等，即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪+地塞米松的有效率。
多个总体率或构成比之间有无差别
多个样本率的多重比较
两个分类变量之间有无关联性
频数分布拟合优度的检验。
检验统计量：
2
应用：计数资料
第一节四格表资料的检验
2
105
5
目的：推断两个总体率（构成比）是否有差别（和u检验等价）
要求：两样本的两分类个体数排列成四格表资料
105
6
2 检验的基本思想一、
α=0.05。
105 18
（2）求检验统计量值
T11 104 174/ 200 90.48 ，T12 104 90.48 13.52
T21 174 90.48 83.52 ，T22 26 13.52 12.48 。
(99 90.48) 2 (5 13.52) 2 (75 83.52) 2 (21 12.48) 2 2 90.48 13.52 83.52 12.48 12.86
105 30
例7-3 某实验室分别用乳胶凝集
法和免疫荧光法对58名可疑系统红斑
狼疮患者血清中抗核抗体进行测定，
结果见表7-3。问两种方法的检测结果有无差别？
105 31
表7-3 两种方法的检测结果
免疫荧光法＋－合计乳胶凝集法＋ 11（a） 2（c） 13 － 12（b） 33（d） 45 合计 23 35 58
2
n 40, T 5 ，专用公式；
n 40, 1 T 5，校正公式；
，直接计算概率。 n 40 或 T 1
2 连续性校正仅用于 1 的四格表资料，当 2
时，一般不作校正。
105 24
例7-2 某医师欲比较胞磷胆碱与
神经节苷酯治疗脑血管疾病的疗效，将78例脑血管疾病患者随机分为两组，结果见表7-2。问两种药物治疗脑血管
2
统计量分布的连续性，则需行连续性
2
校正。
105 22
三、四格表资料检验的校正公式

2 c
( A T 0.5) T
2
n 2 (| ad - bc | - ) n 2 2 c = (a +b)(c + d )(a + c)(b+ d )
105 23
四格表资料检验公式选择条件：
105
40
一、基本思想
在四格表周边合计数固定不变的条件下，计算表内4个实际频数变动时的
各种组合之概率 P ；再按检验假设用 i 单侧或双侧的累计概率 P，依据所取
的检验水准做出推断。
105 41
1．各组合概率Pi的计算在四格表周边合计数不变的条件下，表内4个实际频数 a,b,c,d 变动的组合数共有“周边合计中最小数+1”个。如例7-4，表内4个实际频数变动的组合数共有9+1=10个，依次为：
第七章
检验
2
Chi-Square Test
105 1
Content
• test of fourfold data • 2 test of paired fourfold data • Fisher probabilities in fourfold data 2 • test of R×C table • Multiple comparison of sample rates 2 • test of goodness of fit
105
15
检验统计量值反映了实际频数与理论频数的吻合程度。
2
若检验假设H0:π1=π2 成立，四个格子的实际频数A 与理论频数T 相差不应该很大，即统计量 2 值很大，即相对应的P 值很不应该很大。如果小，若 P ，则反过来推断A与T相差太大，超出了抽样误差允许的范围，从而怀疑H0的正确性，继而拒绝H0，接受其对立假设H1，即π1≠π2 。
检验统计量为
(b c) , 1 bc
2 2

2 c
( b c 1) bc
105
2
, =1
34
注意：
本法一般用于样本含量不太大的资料。因
为它仅考虑了两法结果不一致的两种情况(b, c)，
而未考虑样本含量n和两法结果一致的两种情况 (a, d)。所以，当n很大且a与d的数值很大（即
疾病的有效率是否相等？
105 25
表7-2 两种药物治疗脑血管疾病有效率的比较
组别胞磷胆碱组神经节苷酯组合计有效 46 18 64 无效 6 8（4.67） 14 合计 52 26 78 有效率（%） 88.46 69.23 82.05
105
26
H 0 : 1 2 , H1 : 1 2 , 0.05
0.5 0.4 0.3
1
f ( 2 )
0.2 0.1 0 0 2 4
6
10
6
8
10
12
14
16

105
2
8
2．检验的基本思想
2
例7-1 某院欲比较异梨醇口服液（试验组）和
氢氯噻嗪+地塞米松（对照组）降低颅内压的疗效。将200例颅内压增高症患者随机分为两组，结
果见表7-1。问两组降低颅内压的总体有效率有无
（ ν1+ν2 ）的分布，即 2
( X1 X ～ 2)
2 。
1 2
2 界值：当确定后， 2 分布曲线下右侧尾部的（3）时，横轴上相应的 2 值，记作 , (见附表 8)。 2 面积为
2 值愈大，P 值愈小；反之， 2 值愈小，P 值愈大。
105 7
2
105 2
第一节第二节格表资料的
2 检验配对四格表资料的
四格表资料的 Fisher 确切概率法行×列表资料的检验
2
多个样本率间的多重比较有序分组资料的线性趋势检验（不讲）频数分布拟合优度的检验
2
105 3
目的：
推断两个总体率或构成比之间有无差别
105
32
上述配对设计实验中，就每个对子而言，两种处理的结果不外乎有四种可能: ①两种检测方法皆为阳性数(a)； ②两种检测方法皆为阴性数(d)； ③免疫荧光法为阳性，乳胶凝集法为阴性数(b)； ④乳胶凝集法为阳性，免疫荧光法为阴性数(c)。
105 33
其中，a, d 为两法观察结果一致的两种情况， b, c为两法观察结果不一致的两种情况。
105
10
本例资料经整理成图7-2形式，即有两个处理组，每个处理组的例数由发生数和
未发生数两部分组成。表内有
99 5 75 21
四个
基本数据，其余数据均由此四个数据推算出来的，故称四格表资料。
105 11
处理组甲乙合计
发生数
未发生数
合计 a+b c+d n
a c a+c
b d b+d
nR nC TRC n
式中，TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
105 14
理论频数 T 是根据检验假设 H0 : 1 2 ，且用合并率来估计而定的。如上例，无效假设是试验组与对照组降低颅内压的总体有效率相等，均等于合计的有效率87%。那么理论上，试验组的104例颅内压增高症患者中有效者应为104(174/200)=90.48，无效者为 104(26/200)=13.52；同理，对照组的96例颅内压增高症患者中有效者应为96(174/200)=83.52，无效者为96(26/200)=12.48。
理论依据：超几何分布
（非检验的范畴）
2
105 38
例7-4 某医师为研究乙肝免疫球
蛋白预防胎儿宫内感染HBV的效果，将 33例HBsAg阳性孕妇随机分为预防注射组和非预防组，结果见表7-4。问两组
新生儿的HBV总体感染率有无差别？
105
39
表7-4 两组新生儿HBV感染率的比较

医学统计学 孙振球 第七章 卡方检验

【卫生统计学-资料】_医学统计学课件--第七章_卡方检验

医学统计学课件-卡方检验

医学统计学孙振球(第三版)SAS程序及结果

最新《卫生统计学》第七章 卡方检验(63P)-药学医学精品资料

医学统计学(6) 卡方检验

《医学统计概论》第7章卡方检验Chi-square test

医学统计学：第七章 卡方检验

医学统计学--卡方检验

【孙振球第三版】医学统计学复习题(名词解释和简答)

《医学统计学》习题解答(最佳选择题和简答题)

医学统计学卡方检验

医学统计学第七章卡方检验

医学统计学课件卡方检验

医学统计学--卡方检验

【医学统计学】第七章 X2检验

【医学】《医学统计学》6 Chisquare test

医学统计学孙振球第七章卡方检验

最新《卫生统计学》第七章卡方检验(63P)-药学医学精品资料

医学统计学：第七章卡方检验