祝晓明《医学统计学》医统-第九章卡方检验共58页
医学统计学卡方检验讲课稿
第一页PPT:同学们好,我们今天来一起学习卡方检验的基本思想。
第二页PPT:我们看一个研究案例,某神经内科医师欲比较A、B两种药物治疗脑血栓病人的疗效,将病情轻重、病程相近且满足实验人选标准的200例脑血管栓塞患者随机分为两组,结果见表1。
问两药治疗近期有效率是否有差别?请同学们思考一个问题,结合已学的知识关于两个率的比较我们会使用什么方法呢,那我们继续带着这个问题进入到我们今天的课程学习。
第三页PPT:这节课需要掌握的理论知识有:1.X2检验的定义、主要用途2.X2分布、X2检验的基本思想(这是重点内容)以及应用完全随机设计的四格表X2检验方法是我们这节课的难点内容。
第四页PPT:离散型概率分布有二项分布和泊松分布基于二项分布的假设检验方法可以做两样本率比较的检验问题,条件是np、n(1-p)均大于5,可以做Z检验进行,也是解决我们的案例问题。
第五页PPT:在医学研究中,进行两组或多组样本的总体率(或构成比)之间的差别是否具有统计学意义,X2检验(chi-square test)是解决此类问题较为常用的统计方法,。
X2检验是英国统计学家K.Pearson提出的一种具有广泛用途的假设检验方法,常用于分类变量资料的统计推断。
第六页PPT:X2检验主要用于:1.推断两个及多个总体率或总体构成比之间有无差别2.两种属性或两个变量之间有无关联性3.频数分布的拟合优度检验4.百分率线性趋势检验第七页PPT:我们来继续看我们的案例,两药有效率的比较问题。
表中我们A 药、B药的有效和无效分别为99、5、75、21,我们可以用a.b.c.d 来表示,表中其余的数据是由abcd这4个数据推算出来,我们习惯将这种资料形式称为四格表。
为什么叫四个表因为它有效的就是四个格子。
a.b.c.d是我们实际观察所得到的频数,我们叫实际频数(actual frequency),用A表示。
根据我们的研究目的,我们要比较两个率是否有差别的问题。
祝晓明医学统计学医统卡方检验
要考查西安医学院临床专业01班和02班 的系统解剖的及格率,从01班抽取20人 (其中15人及格,5人挂科),从02班抽 取30人(其中20人及格,10人挂科)。 问这两个班级的及格率有无不同?哪个 班级学习成绩更好?
四格表资料的基本形式
处理组 甲 乙 合 +d n
0.05
2.计算检验统计量
2 c
T12 =44-25.77=18.23
T21 =41-25.77=15.23,
T22 =26-15.23=10.77
按公式(9-1)计算 2 值
(20 25.77) 2 (24 18.23) 2 (21 15.23) 2 (5 10.77) 2 8.40 25.77 18.23 15.23 10.77
Pearson提出的一种主要用于分析分类变
量数据的假设检验方法.
目的:
推断两个总体率或构成比之间有无差别 推断多个总体率或构成比之间有无差别
Karl Pearson
检验统计量:χ2
应用:计数资料
第一节
四格表资料的χ2 检验
目的:推断两个总体率(构成比)是 否有差别 要求:两样本的两分类个体数排列成 四格表资料
2
(2 1)(2 1) 1
3.确定P 值,作出推断结论
0.5 0.4 0.3
ß ×· Ý
× Ô Ó É ¶ È £ ½ 1
0.2 0.1 0.0 0 3 6 9 12 ¿ ¨· ½ Ö µ
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6
二、四格表资料χ2检验的专用公式
专用公式:
(ad bc) n (a b)(c d )(a c)(b d )
医学统计课件人卫6版 第九章 卡方检验ppt课件
数中的最小值所对应格子的理论频数最小。
➢ 两样本率比较的资料,既可用Z检验也可用 检2
验来推断两总体率是否有差别,且在不校正的 条件下两种检验方法是等价的,对同一份资料
有
Z2 2
讨论:计算与分析1.2.
.
11
补充:
两大样本率的假设检验
1)样本率与总体率比较: Z p0 0(10)/n
➢ 基本公式:
2
(AT)2
T
.
3
➢ T值是在假设H0 成立的条件下,求得的理论频数
TR C
nR .nC n
➢ TRC 表示R行C列的理论频数
➢ nR 为相应行的合计,nC 为相应列的合计
➢ n 为总例数
.
4
求得χ2 值,按ν =(R - 1)(C - 1)
➢ 查附表7,得P值。 同一自由度下,χ2值越大, ➢ 相应的概率P值越小。
• 此类设计可作两方面的统计分析:
.
13
1.两法检验结果有无差别: (阳性检出率是否不同)
2 (b c)2
bc
ν=1
若观察频数b+c < 40,需对χ2值进行校正
2(b | c|1)2
bc
.
14
2.两法检验结果有无关系(联)(了解) H0 :两法结果无关联 H1 :两法结果有关联
α = 0.05
.
18
行×列表资料检验的专用公式:
2 n(
A2 1)
nRnC
(行数-1)(列数-1)
例9-5;9-6
.
19
行×列表资料 检2 验的注意事项
1.一般认为,行×列表中的理论频数不应小于1, 或 的1格T子5 数不宜超过格子总数的1/5。若 出现上述情况,可通过以下方法解决:①最好 是增加样本含量,使理论频数增大;②根据专 业知识,考虑能否删去理论频数太小的行或列, 能否将理论频数太小的行或列与性质相近的邻 行或邻列合并;③改用双向无序 R×C列表的 Fisher确切概率法。
医学统计学 -第09章 卡方检验
0.4 f(x)
v=1
0.3
2分布
0.2
v=4
v=6 v=9
0.1
0.0
0
3
6
9
12
15 x
(2)计算检验统计量
2 (A T )2
T
(41 36.5625)2 (4 8.4375)2 (24 28.4375)2 (11 6.5625)2
36.5625
8.4375
28.4375
6.5625
理论基础:超几何分布,不属于卡方检验
谢谢
表 慢性咽炎两种药物疗效资料
分组
兰芩口服液 银黄口服液
合计
有效
41 24 65
无效
4 11 15
有效率 (%) 91.11
68.57 81.25
合计
45 35 80
问题: 两个总体有效率是否相等?
(1)建立检验假设 H0:π1=2 两药的总体有效率相同 H1:π1≠π2 两药的总体有效率不同 检验水准=0.05
bc
= 1
若b+c<40,采用以下校正公式
2 (| b c | 1)2
= 1
bc
第三节 行×列表资料的2检验
(一)R×C表 最常见的形式是
2×C列联表(一般为2个构成比的比较) R ×2列联表(一般为多个样本率的比较)
R×C列联表2检验的原理与2×2列联表2 检验的原理完全一样
统计量计算公式
合计 40 30 32 102
有效率(%) 87.50 66.67 21.88 60.78
(1)建立检验假设,确定检验水准
H0 :1 2 3
H1
:
1
,
医学统计学卡方检验
资料仅供参考,不当之处,请联系改正。
χ2检验的自由度
• χ2检验,根据自由度ν和检验水α准查表得χ2界值。
• 当ν确定后, χ2分布曲线下右侧尾部的面积为α时,横
轴上相应的χ2值记作
2 ,
。
• 当ν确定后, χ2值越大,P值越小。
资料仅供参考,不当之处,请联系改正。
四格表资料χ2检验的专用公式
资料仅供参考,不当之处,请联系改正。
χ2 检验
是现代统计学的创始人之一,英国统 计学家Karl Pearson于1900年提出的 一种具有广泛用途的假设检验方法。常 用于推断两个总体率(或构成比)之间 有无差别。
资料仅供参考,不当之处,请联系改正。
四格表资料的χ检验
2
资料仅供参考,不当之处,请联系改正。
旧药
2
14
16
12.5
新药
3
8
11
27.3
合计
5
22
27
18.5
⑴设H0 :π1=π2 ,即两药疗效相同;H1 : π1≠π2
基本思想
实际频数(actual frequency,A):a、b、c、 d 理论频数(theoretical frequency,T )
资料仅供参考,不当之处,请联系改正。
假设H0:πA=πB=π,即A组与B组治疗的总体有效率相 等
A组:理论有效者=(a+b)×(a+c)/n; 理论无效者=(a+b)×(b+d)/n
资料仅供参考,不当之处,请联系改正。
Fisher确切概率法的基本思想
在四格表周边合计数固定不变的条件下,利用超几何分 布(hypergeometric distribution)公式直接计算表内 四个格子数据的各种组合的概率,然后计算单侧或双侧累 计概率,并与检验水准比较,作出是否拒绝H0的结论。
医学统计学第版卡方检验课件
Φ(X1) (3) 0.00069 0.00466 0.02275 0.08076 0.21186 0.42074 0.65542 0.84134 0.94520 0.98610 —
Φ(X2) (4) 0.00466 0.02275 0.08076 0.21186 0.42074 0.65542 0.84134 0.94520 0.98610 0.99744 —
阴性 39 104 143
合计 72 114 186
阳性率(%) 45.8 8.8 23.1
处理组 发生数 未发生数 合计
甲
a
b
a+b
乙
c
d
c+d
合计
a+c
b+d
n
四格表医资学统料计学的第版基卡方本检验形式
23
二、 χ2 检验的基本思想
分组 肺癌组 对照组
合计
例 8.1 CEA 对两组人群的诊断结果
45356515
医学统计学第版卡方检验
30
• 当n≥40时,如果有某个格子出现1≤T<5,一般需
x2 统计量的含义
TRC
对应P 值
(R 1 )C ( 1 )
各种情形下,理论频数与实际频数偏离的总和即为χ2值(chi-
square value),它服从自由医度学统为计学ν第的版卡χ方2检分验 布。
24
一、二分类情形——2×2列联表
例7-2 某医师研究用兰芩口服液与银黄口服液治疗 慢性咽炎疗效有无差别,将病情相似的80名患者 随机分成两组,分别用两种药物治疗,结果见表 7-2。
28
( 4 3 1 .5 6 ) 2 6 ( 4 8 .4 ) 2 4 ( 2 2 4 .4 8 ) 2 4 ( 1 6 1 .5 ) 2 6 6 .565 3 .5 66 8 .44 2 .4 84 6 .56
最新【基础医学】第九章 卡方检验幻灯片课件
表9-8 不同文化程度患者首选疼痛量表的类型
文 化 程 度
高 中 以 下 高 中
高 中 以 上 合 计
V AS 3(3.5) 0(1.6) 4(1.8)
7
首 选 测 痛 量 表
V DS
NRS
16(18.7) 10(8.6)
18(19.7) 9(9.0)
11(9.7)
12(10.2)
37
39
FPS 44(39.0) 18(17.8) 15(20.2)
时,一般不作校正。
例9-2 将116例癫痫患者随机分
为两组,一组70例接受常规加高压氧 治疗(高压氧组),另一组46例接受 常规治疗(常规组),治疗结果见表 7-4。问两种疗法的有效率有无差别?
表9-3 两种疗法治疗癫痫的效果
治 疗 方 法
治 疗 结 果
有 效
无 效
高 压 氧 组 66( 62.8)
四格表资料检验的专用公式
2
(adbc)2n
(ab)(ac)(bd)(cd)
2(331041039)218634.10
7243143114
(四)四格表资料检验的校正公式
c2
( AT 0.5)2 T
(|ad-bc|-n)2n
c2
=
2
(a+b)(c+d)(a+c)(b+d)
2 分布是一连续型分布,而四格
合 计
乙 剂 量
死 亡 (+ )
生 存 (- )
6( a) 3( c)
12( b) 18( d)
9
30
合 计
18 21 39
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能:
卫生统计学-第九章 卡方检验
率,需要将检验水准调整为,按照Bonferroni校
正法,计算方法为:
'
比较的次数
'
k(k 1) / 2 1
• 式中,k为比较的样本组数。
32
例5 对例3三个地区的出生婴儿的致畸率的分析结 果作进一步的两两比较。
• 本例3组率的两两比较,要进行1次总检验和3次
两两比较检验,共要比较4次,故
T
17.45
62.55
18.55
66.45
4.38
(2 1)(2 1) 1
13
2分布
2分布是一种连续型随机变量的概率分布。
14
2分布规律
• 自由度一定时,P值越小,2值越大。 • 当P 值一定时,自由度越大,2越大。
=1时, P=0.05,2 =3.84 P=0.01,2 =6.63
24
1 多个样率的比较
例3: 某市重污染区、一般市区和农村的出生婴儿 的致畸情况如下表,问三个地区的出生婴儿的 致畸率有无差别?表 某省三个地区花生黄曲
25
(1)建立检验假设,确定检验水准 H0:1 2 3,即三个地区的出生婴儿的致畸率相等 H1:1、 2、 3 之间不等或不全相等 =0.05
本例若对2值不校正,2=4.06,得P<0.05,结论
正好相反。
23
第三节 行列表的2检验
四格表是指只有2行2列,当行数或列数超过2时,
统称为行列表。行列表的x2检验是对多个样本
率(或构成比)的检验。 基本公式: 2 =(A-T)2/T 专用公式: 2 =n ( A2 /nR nC –1) 自由度:=(R-1) (C-1) 适用条件:表中不宜有1/5以上格子的理论频数小 于5,或有一个格子的理论频数小于1。
医学统计学卡方检验
03 左侧概率为P =P1+ P2 + P3 =0.316 , 右侧概率为P =P3+ P4 + P5 + P6 =0.929,故单侧检验P值为0.316。
Part 02.
配对四格表资料的 检验
χ2
概述
计数资料的配对设计常用于两种检验方 法、培养方法、诊断方法的比较。 特点是对样本中各观察单位分别用两种 方法处理,然后观察两种处理方法的某 两分类变量的计数结果,整理为
的条件下,利用超几何分布
Fisher确切概率法的基本思想
(hypergeometric distribution)公式直接计算 表内四个格子数据的各种组合 的概率,然后计算单侧或双侧
“!”为阶乘符号, n !=1×2×…×n,0 !=1, ∑Pi=1。
累计概率,并与检验水准比较,
P( ab)( c 作! 出 a 是! 否db 拒! ) 绝cH! ( 0a d 的! ! 结 论n! 。c)( b!d)!
当T<1或n<40,四格表资料χ2检验结果 可能会有偏性,需采用Fisher确切检验 进行分析。该法由R. A. Fisher提出,且 直接计算概率,因此也叫Fisher确切概 率检验(Fisher’s exact probability test)。
四格表资料的Fisher确切概率法
在四格表周边合计数固定不变
否有差别?
⑴设H0 :π1=π2 ,即两药有效率相同;H1 : π1≠π2 α=0.05
⑵n>40,Tmin>5
2 5 5 2 . 1 7 2 8 1 1 9 . 8 3 2 2 3 3 9 . 8 3 2 2 3 8 . 1 2 8 6 . 48 5 . 1 7 81 . 8 3 23 . 8 3 28 . 18
医学统计学-第九章计数资料的参数估计与卡方检验
率的标准误的计算公式:
p
(1-)
n
式中,δp 为率的标准误,π为总体率,n为样本含量
在实际工作中,由于总体率π很难知道,常用样本率P来代 替,故公式变为:
sp
Sp为率的标准误的估计值
p(1 p)
n
p为样本率
n为样本含量
方法: 1.查表法:当样本含量较小(如n≤50),特别是np或n(1-p)较小时,p呈偏态 分布, 可根据样本含量n和阳性数x,查相关统计学教材“百分率的可信区间” 表,求得总体率可信区间。 2.正态近似法:当样本含量足够大(如n﹥50),且样本率p或1-p均不太小, 如np和n(1-p)均≥5时,样本率的分布近似正态分布,可按下列公式计算 :
第二步:计算检验统计量
2 ( A T )2
T
式中: A 为实际频数(actual frequency)T 为理论频数(theoretical frequency)
第三步:确定 P 值,得出结论
x2=9.32
ν=(R-1)(C-1)=(2-1)(2-1) 由 2界值表查得 20.05,1 = 3.84 ,
组别 有效 无效 合计
H0成立下的有效率(%)
中药
T11
T12
160
西药
T21
T22
140
72.7% 72.7%
合计 218
82
300
72.7%
T11 =160 ×72.7%= 160×(218/300)=116.3 T12 =160 ×(1-72.7%)= 160×(82/300)=43.7 T21 =140 ×72.7%= 140×(218/300)=101.8 T22 =140×(1-72.7%)= 140×(82/300)=38.2
祝晓明医学统计学医统-第九章卡方检验课件
例9-3 某研究者为研究乙肝免疫球蛋白预防白兔胎 儿宫内感染HBV的效果,将17例HBsAg阳性白兔 随机分为预防注射组和非预防组,观察两组所产出 的新生白兔HBV感染情况,结果见表9-3。问两组 新生白兔的HBV总体感染率有无差别?
祝晓明医学统计学医统-第九章卡方检验
2 检验(chi-square test):英国统计学家
Pearson提出的一种主要用于分析分类变 量数据的假设检验方法.
目的:
推断两个总体率或构成比之间有无差别 推断多个总体率或构成比之间有无差别 检验统计量:χ2 应用:计数资料
Karl Pearson
祝晓明医学统计学医统-第九章卡方检验
第一节
χ2连续性校正仅用于ν =1 的四格表资料,当ν≥2
时,一般不作校正。
校正公式:
2 c
( A T 0.5)2 T
c
(| ad - bc | -n / 2 = 祝晓明医学统计学医统-第九章卡方检验
(a +b)(c + d )(a +
2)2 n c)(b +
d
)
Frank Yates
四格表资料χ2 检验公式的选择:
1
一、率
率(rate):率表示在一定空间或时间范围内 某现象的发生数与可能发生的总数之比,说明 某现象出现的强度或频度,通常以百分率 (%)、千分率(‰)、万分率(/万)、或 十万分率(/10万)等来表示。
你们班级的及格率,挂科率怎么算?
计算公式如下:
率 某事物或现象发生的实 际数 比例基数 某事物或现象发生的所 有可能数 祝晓明医学统计学医统-第九章卡方检验
祝晓明医学统计学医统-第九章卡方检验
医学统计学课件卡方检验
队列研究中的卡方检验
总结词
在队列研究中,卡方检验用于比较不同暴露 水平或不同分组在某个分类变量上的分布差 异,以评估暴露因素与疾病发生之间的关系 。
详细描述
队列研究是一种前瞻性研究方法,按照暴露 因素的不同将参与者分为不同的组,追踪各 组的疾病发生情况。通过卡方检验,可以比 较不同暴露水平或不同分组在分类变量上的 分布差异,如分析不同饮食习惯的人群中患
卡方检验与相关性分析的区别
卡方检验主要用于比较实际观测频数与期望频数之间的差异,而相关性分析则用于研究 两个或多个变量之间的关联程度。
卡方检验与相关性分析的联系
在某些情况下,卡方检验的结果可以为相关性分析提供参考,帮助了解变量之间的关联 程度。
05
卡方检验的应用实例
病例对照研究中的卡方检验
总结词
02
公式
卡方检验的公式为 $chi^{2} = sum frac{(O_{ij} - E_{ij})^{2}}{E_{ij}}$,
其中 $O_{ij}$ 表示实际观测频数,$E_{ij}$ 表示期望频数。
03
适用范围
卡方检验适用于两个分类变量的比较,可以用于分析病例对照研究、队
列研究等类型的研究。
卡方检验的用途
如比较不同年龄组、性别组等人群中某种疾病的患病率。
卡方检验的基本假设
每个单元格中的期望 频数应该大于5。
卡方检验对于样本量 较小的情况可能不适 用。
观察频数与期望频数 应该服从相同的概率 分布。
02
卡方检验的步骤
收集数据
01
02
03
确定研究目的
在开始卡方检验之前,需 要明确研究的目的和假设 ,以便有针对性地收集数 据。
卫生统计学9——卡方检验
51 33
其余数据都是由以上四个数据计算出来的。
这四个数叫实际频数,简称实际数
(actual freqency, A)
12
理论频数(theoretical freqency,T)
对于洛赛克组的64人,按照合并愈合率Pc=68.05%治疗 的话,理论上: 64×68.05%=57.84人愈合,用T11表示,
?
(1)先假设H0成立,按特定分布的规律(概率函数)
计算理论频数,进而计算 2值。
(2)若 2值小,可认为现有资料服从某一分布;
若 2值大,尚不能认为现有资料服从某一分布。
自由度=K-参数个数-1 K:组段数 参数个数:正态分布和二项分布有2个参数,poisson分布有1个
30
例9-1 对数据作正态分布拟合优度检验。120名 男孩身高的测量值, 均数=139.48cm;标准差=7.30cm
为v 。
2 u12 u22 u2
ui
Xi
5
2 分布的拓展与应用
卡方检验基本思想
2 分布的概念
1875年,F. Helmet得出:来自正态总体的样
本方差的分布服从 2分布;
1900年K. Pearson又从检验分布的拟合优度
(goodness of fit)中也发现了这一相同的 2 分
统计量2值。
33
计算统计量:
计算T I 时的参数有2 个(均数和标准差)
2
(A T )2 6.27
T
推断结论:自由度=10-1-2=7,查Leabharlann 表8,得到2 0.50,7
6.35
P>0.50,可以认为该样本服从正态分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
×Ô ÓÉ ¶È £½ 3
0.1
×Ô ÓÉ ¶È £½ 6
0.0
0
3
6
9 12 15 18
¿¨·½ Öµ
Ý×߸
当自由度ν确定后,χ2分布曲线下右侧尾部的面积 为α时,横轴上相应的χ2值记作χ2α,ν
查χ2界值表,得χ20.05,1=3.84,按α =0.05 水 准, 拒绝H0 , 接受H1 , P<0.05,可 以认为两组治疗原发性高血压的总体有 效率不同,即可认为吲达帕胺片治疗原 发性高血压是有效的。
3.确定P值,作出推断结论 P >0.05,不拒绝H0,尚不能认为两种培养基的
阳性培养率不同
第三节 行×列表资料的χ2检验
行×列表资料
① 多个样本率比较时,
有 R 行 2 列,称为 R ×2表;
② 两个样本的构成比比较时,
有 2 行 C 列,称 2×C 表;
③ 多个样本的构成比比较,
有 R 行 C 列,称为 R ×C 表。
例9-3 某研究者为研究乙肝免疫球蛋白预防白兔胎 儿宫内感染HBV的效果,将17例HBsAg阳性白兔 随机分为预防注射组和非预防组,观察两组所产出 的新生白兔HBV感染情况,结果见表9-3。问两组 新生白兔的HBV总体感染率有无差别?
1.建立检验假设并确定检验水准
H
:
0
1
2
,即两组新生白兔HBV的总体感染率相等
表9-5 A、B两种培养基的培养结果
上述配对设计实验中,就每个对子而言,两种处 理的结果不外乎有四种可能:
a ① A、B两种检测方法皆为阳性数(?); d ② A、B两种检测方法皆为阴性数 (?); b ③ A法为阳性、B法为阴性数 (?); c ④ A法为阴性、B法为阳性数 (?)。
其中,a, d 为两法观察结果一致的两种情况,
果有统计学意义,其实际意义往往也不大。
1.建立检验假设并确定检验水准 H0:B=C,即两种培养基的阳性培养率相等 H1:B≠C,即两种培养基的阳性培养率不相等 α =0,05
2.计算检验统计量 本例b+c>40,用非校正公式计算得
2 (24 - 20)2 0.36, 1
24 20
第二节 配对四格表资料的 χ2 检验
与计量资料推断两总体均数是否有 差别有成组设计和配对设计一样,计 数资料推断两个总体率(构成比)是 否有差别也有成组设计和配对设计, 即四格表资料和配对四格表资料。
例9-4 现有198份痰标本,每份标本分别用A、 B两种培养基培养结核菌,问A、B两种培养基 的阳性培养率是否不等?
检验的自由度取决于可以自由取值的格子数目,
而不是样本含量n。四格表资料只有两行两
列,ν=1,即在周边合计数固定的情况下,4个基 本数据当中只有一个可以自由取值。
检验步骤: 1.建立检验假设并确定检验水准 H0:π1=π2 即试验组与对照组的总体有效率相等 H1:π1≠π2 即试验组与对照组的总体有效率不等
A 为实际频数,T 为理论频数, 为自由度。
理论频数计算公式
Tij
nin j n
Tij 为第 i 行第 j 列的理论频数,ni 和nj 分别为
相应行与列的周边合计数,n 为总例数。
检验统计量χ2 值反映了实际频数 与理论频数的吻合程度。
若检验假设H0:π1=π2成立,四个格子的实 际频数A 与理论频数T 相差不应该很大,即
b, c为两法观察结果不一致的两种情况。
检验统计量(McNemar test)
注意:
本法一般用于样本含量不太大的资料。因 为它仅考虑了两法结果不一致的两种情况
(b, c),而未考虑样本含量n和两法结果一 致的两种情况(a, d)。所以,当 n 很大且 a 与 d 的数值很大(即两法的一致率较高), b 与 c 的数值相对较小时,即便是检验结
表9-7 三个不同地区血型样本的频分布
地区
A
B
AB
O
亚洲
321
369
95
295
欧洲
258
43
22
194
北美洲
408
106
37
444
合计
987
518
154
933
H0? H1?
合计 1080 517 995 2592
行×列表资料 χ2 检验的 注意事项
1.理论频数:行列表中的各格T≥1,并且1≤T
<5的格子数不宜超过1/5格子总数,否则可能 产生偏性。处理方法有三种: 1) 增大样本含量以达到增大理论频数的目的, 属首选方法,只是有些研究无法增大样本含量, 如同一批号试剂已用完等。
χ2连续性校正仅用于ν =1 的四格表资料,当ν≥2
时,一般不作校正。
校正公式:
2 c
( A T 0.5)2 T
c2
=
(| ad (a +b)(c
Hale Waihona Puke - bc | -n / + d )(a +
2)2 n c)(b +
d
)
Frank Yates
四格表资料χ2 检验公式的选择:
n 40, T 5,基本公式/专用公式;
2) 根据专业知识,删去理论频数太小的行或 列,或将理论频数太小的行或列与性质相近 的邻行或邻列合并。例如:不同年龄组可以 合并,但不同血型就不能合并。
3) 改用双向无序R×C表的Fisher确切概率法 (可用SAS软件实现)。
2.多个样本率比较:若所得统计推断为拒绝 H0,接受H1时,只能认为各总体率之间总 的来说有差别,但不能说明任两个总体率之 间均有差别。要进一步推断哪两两总体率之 间有差别,需进一步做多个样本率的多重比 较。
有效 51 35 59 145
无效 49 45 15 109
合计 100
80 74 254
有效率(%) 51.00 43.75 79.73 57.09
H0? H1?
例9-6 某研究人员收集了亚洲、欧洲和北美洲人 的A、B、AB、O血型资料,结果见表9-7,问不 同地区人群ABO血型分类构成比是否不同。
要求:两样本的两分类个体数排列成 四格表资料
要考查西安医学院临床专业01班和02班 的系统解剖的及格率,从01班抽取20人 (其中15人及格,5人挂科),从02班抽 取30人(其中20人及格,10人挂科)。 问这两个班级的及格率有无不同?哪个 班级学习成绩更好?
四格表资料的基本形式
处理组 发生数 未发生数 合计
2 (20 25.77)2 (24 18.23)2 (2115.23)2 (5 10.77)2 8.40
25.77
18.23
15.23
10.77
(2 1)(2 1) 1
3.确定P 值,作出推断结论
0.5
0.4
0.3
×Ô ÓÉ ¶È £½ 1
0.2
×Ô ÓÉ ¶È £½ 2
四、四格表资料的Fisher确切概率法(自学)
当四格表资料中出现n<40 或T <1,需改用四格表 资料的Fisher确切概率法。该法是一种直接计算 概率的假设检验方法,其理论依据是超几何分布 (hypergeometric distribution)。四格表的确切 概率法不属于检验的范畴,但常作为四格表资料 假设检验的补充。
甲
a
b
a+b
乙
c
d
c+d
合 计 a+c
b+d
n
例9-1 吲达帕胺片治疗原发性高血压疗效,将70名高 血压患者随机分为两组,试验组用吲达帕胺片加辅 助治疗,对照组用安慰剂加辅助治疗。试分析有效 性。
一、 2检验的通用公式
通用公式:
2 ( A T )2
T
=(行数-1)(列数-1)
阳性
8 0
阴性
1 8
a-Ta -3.76
7
2
2
1
7
-2.76
3
6 2
3 6
-1.76
5
4
4
3
5
-0.76
4
5
5
4
4
0.24
3
6
6
5
3
1.24
7*
2
7
6
2
2.24*
8
1 7
8 1
3.24
0
9
9
8
0
4.24
* 为实际数据的四格表
P 0.000370 0.011847 0.096750 0.290251 0.362814 0.193501 0.041464* 0.002962 0.000041
二、四格表资料χ2检验的专用公式
专用公式:
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
2 (20 5 24 21)2 70 8.40
44 26 41 29
结论同前。
三、四格表资料χ2检验的校正公式
χ2分布是一连续型分布,而四格表资料属离散型分 布,由此计算得的 χ2统计量的抽样分布亦呈离散性质。 为改善χ2 统计量分布的连续性,则需行连续性校正。
H1:1 2 即两种药物治疗脑血管疾病的有效率不相等
0.05
2.计算检验统计量
c2
6
25
3 24 49 9
58 / 22
28 30
58
0.376
(2 1)(2 1) 1
3.确定P 值,作出推断结论
不拒绝H0,尚不能认为两种药物治疗脑血管疾 病的有效率不相等