理学第七章卡方检验
合集下载
《卡方检验正式》课件
卡方检验的结果可以直接解释为实际意义 ,例如,如果卡方值较大,则说明观察频 数与期望频数存在显著差异。
缺点
对数据要求高
卡方检验要求数据量较大,且各分类的期望频数不能太小,否则可能 导致结果不准确。
对离群值敏感
卡方检验对离群值比较敏感,离群值可能会对结果产生较大的影响。
无法处理缺失值
卡方检验无法处理含有缺失值的数据,如果数据中存在缺失值,需要 进行适当的处理。
案例二:市场研究中的卡方检验
总结词
市场研究中,卡方检验用于评估不同市 场细分或产品特征与消费者行为之间的 关联。
VS
详细描述
在市场研究中,卡方检验可以帮助研究者 了解消费者对不同品牌、产品或服务的偏 好。例如,通过比较不同年龄段消费者对 某品牌的选择比例,企业可以更好地制定 市场策略和产品定位。
案例三:社会调查中的卡方检验
小,表示两者之间的差异越小。通常根据卡方值的概率水平来判断差异
是否具有统计学显著性。
02
卡方检验的步骤
建立假设
假设1
观察频数与期望频数无显著差异
假设2
观察频数与期望频数有显著差异
收集数据
从样本数据中获取观察频数 确定期望频数,可以使用理论值或预期频数
制作交叉表
将收集到的数据整理成二维表格形式,行和列分别表示分类变量
卡方检验的基本思想
01
基于假设检验原理
卡方检验基于假设检验的原理,通过构建原假设和备择假设,利用观测
频数与期望频数的差异来评估原假设是否成立。
02
比较实际观测频数与期望频数
卡方检验的核心是比较实际观测频数与期望频数,通过卡方值的大小来
评估两者之间的差异程度。
03
卡方检验
27
表7 - 8
三种疗法有效率的比较 合计 有效率(%) 有效率(%) 206 182 144 532 96.60 90.11 81.94 90.41
疗法 物理疗法组 药物治疗组 外用膏药组 合计
有效 199 164 118 481
无效 7 18 26 51
28
检验步骤1 检验步骤1-建立假设
H0:三种疗法的有效率相等
免疫荧光法 + -
合计
+
11(a)
12(b)
23
-
2(c)
33(d)
35
合计
13
45
58
20
检验步骤1 检验步骤1-建立假设
H0:两种方法的检测结果相同
H1:两种方法的检测结果不相同
确定检验水准:α = 0.05
21
检验步骤2 检验步骤2-计算检验统计量
(b-c)2 2 未校正计算公式: 未校正计算公式:χ = b+c
P<0.05
结论:在 α = 0.05水准上,拒绝H0,接受H1,可以认 结论: 水准上,拒绝H 接受H 为三种疗法的有效率不全相等(统计学结论),可 ),可 为三种疗法的有效率不全相等(统计学结论), 以认为三种疗法治疗周围性面神经麻痹的有效率有 差别(专业结论)。 差别(专业结论)。
31
多个样本构成比的比较
14
四格表专用公式: 四格表专用公式:
(A−T) χ =∑ T
2
2
2
(ad −bc) N χ = (a +b)(c + d)(a + c)(b + d)
2
(99×21−5×75) ×200 本 : = 例 χ =12.86 104×96×174×26
《医学统计概论》第7章卡方检验Chi-square test
(2) 当n≥40,有任一格1≤T<5时,可用Yates校正公式;
(3) 当n<40或有T<1时,用Fisher’s exact probability。
7.2 配对四格表资料的χ2检验
配对设计包括:(1)同一批样品用两种不同的处理方法;(2)观察 对象根据配对条件配成对子,同一对子内不同的个体分别接受不同的处理; (3)在病因和危险因素的研究中,将病人和对照按配对条件配成对子, 研究是否存在某种病因或危险因素。
表7-1 两组降低颅内压有效率的比较(P137)
组别
试验组 对照组 合计
有效
99 75 174
无效
5 21 26
合计
104 96 200
有效率(%)
95.20 (p1) 78.13 (p2) 87.00 (pc)
实际频数A (actual frequency) 理论频数T (theoretical frequency)
,
1
因为有一格1<T<5,且n>40时,所以应用连续性校
正χ2检验。
四、精确概率法(Fisher’s exact probability)
在无效假设成立的前提下且周边合计固定时,产生任意 一个四格表(i)的概率Pi 服从于超几何分布,其计算式为:
a b!c d !a c!b d !
Pi
a!b!c!d !n!
药物治疗组 164
18
182
外用膏药组 118
26
144
4.59
>0.0125 (NS)
合计
282
44
326
二、各实验组与同一对照组比 关键是检验水平的校正
'
2k 1
自学
7.6 双向有序分组资料的线性趋势检验
(3) 当n<40或有T<1时,用Fisher’s exact probability。
7.2 配对四格表资料的χ2检验
配对设计包括:(1)同一批样品用两种不同的处理方法;(2)观察 对象根据配对条件配成对子,同一对子内不同的个体分别接受不同的处理; (3)在病因和危险因素的研究中,将病人和对照按配对条件配成对子, 研究是否存在某种病因或危险因素。
表7-1 两组降低颅内压有效率的比较(P137)
组别
试验组 对照组 合计
有效
99 75 174
无效
5 21 26
合计
104 96 200
有效率(%)
95.20 (p1) 78.13 (p2) 87.00 (pc)
实际频数A (actual frequency) 理论频数T (theoretical frequency)
,
1
因为有一格1<T<5,且n>40时,所以应用连续性校
正χ2检验。
四、精确概率法(Fisher’s exact probability)
在无效假设成立的前提下且周边合计固定时,产生任意 一个四格表(i)的概率Pi 服从于超几何分布,其计算式为:
a b!c d !a c!b d !
Pi
a!b!c!d !n!
药物治疗组 164
18
182
外用膏药组 118
26
144
4.59
>0.0125 (NS)
合计
282
44
326
二、各实验组与同一对照组比 关键是检验水平的校正
'
2k 1
自学
7.6 双向有序分组资料的线性趋势检验
第七章卡方检验
? 重点与难点
? 重点:适合性检验、独立性检验的方法 ? 难点: χ 2分布与分割
? 思考题及作业 1、χ 2检验与t检验、F检验在应用上有什么区别? 2、什么情况下检验需作矫正?如何矫正?为什么? 3、为什么要应用分解法来分解总值? 4、习题作业:《标准化综合测试题》第七章1—7题
? 参考书
1.贵州农学院(主编).2001.《生物统计附试验设计》教材. 中国农 业出版社. 115~137页
仅适用
于df=1,而不适用于df>1。当n的数量很大,非连续性作用,即使df=1的情况改
变 ? 2 值也很小。如果df=1,n又很小,不足以计算无偏倚的 ? 2 值,可用直接概
率计算法来计算较为精确的 ? 2 值(计算方法详见本章补充内容)。df=1的资料,
当理论次数很小时,而总的分组格子数中E<5的理论次数不能超过1/5。若遇到
两对性状是否符合9︰3︰3︰1的比例等符合程度的检验。需应用? 2 检验中的
适合性检验来作检验。又如:在方差分析中的方差齐性检验和对所取资料分布 类型是否符合所属的理论分布,都需作适合性检验。此外,对于次数资料两因
子之间是相关性的研究,需应用 ? 2检验中独立性检验,来检验两因子之间是
相互独立还是关联的。如:注射某种疫苗与对该病的防治有无关联。在畜牧生 产中,常对一些数量性状,通过划分不同等级以次数资料的形式表示。如:奶 牛产奶量。以某一产奶量范围而定出高产牛、低产牛,对牛群产量的高低,将 奶牛分成两类。羊的产毛量以剪毛量多少也可分为高、中、低三个等级。这就 是说把数量性状的资料又转化以次数资料的形式来表示时,对其作显著性检验 也必须用独立性检验。 二、? 2 检验的原理
2.扬茂成(主编).1990.兽医统计学。中国展望出版社. 116~134页
? 重点:适合性检验、独立性检验的方法 ? 难点: χ 2分布与分割
? 思考题及作业 1、χ 2检验与t检验、F检验在应用上有什么区别? 2、什么情况下检验需作矫正?如何矫正?为什么? 3、为什么要应用分解法来分解总值? 4、习题作业:《标准化综合测试题》第七章1—7题
? 参考书
1.贵州农学院(主编).2001.《生物统计附试验设计》教材. 中国农 业出版社. 115~137页
仅适用
于df=1,而不适用于df>1。当n的数量很大,非连续性作用,即使df=1的情况改
变 ? 2 值也很小。如果df=1,n又很小,不足以计算无偏倚的 ? 2 值,可用直接概
率计算法来计算较为精确的 ? 2 值(计算方法详见本章补充内容)。df=1的资料,
当理论次数很小时,而总的分组格子数中E<5的理论次数不能超过1/5。若遇到
两对性状是否符合9︰3︰3︰1的比例等符合程度的检验。需应用? 2 检验中的
适合性检验来作检验。又如:在方差分析中的方差齐性检验和对所取资料分布 类型是否符合所属的理论分布,都需作适合性检验。此外,对于次数资料两因
子之间是相关性的研究,需应用 ? 2检验中独立性检验,来检验两因子之间是
相互独立还是关联的。如:注射某种疫苗与对该病的防治有无关联。在畜牧生 产中,常对一些数量性状,通过划分不同等级以次数资料的形式表示。如:奶 牛产奶量。以某一产奶量范围而定出高产牛、低产牛,对牛群产量的高低,将 奶牛分成两类。羊的产毛量以剪毛量多少也可分为高、中、低三个等级。这就 是说把数量性状的资料又转化以次数资料的形式来表示时,对其作显著性检验 也必须用独立性检验。 二、? 2 检验的原理
2.扬茂成(主编).1990.兽医统计学。中国展望出版社. 116~134页
卡方检验ppt课件(1)_OK
0.86 0.91 0.94 0.87 0.91 0.86 0.95 0.87 0.92 0.92
0.97 0.92 0.87 0.90 0.90 0.89 0.85 0.92 0.87 1.06
0.99 0.86 0.92 0.84 0.84 0.95 0.92 0.87 0.90 0.84
0.92 0.85 0.92 0.87 0.87 0.98 0.97 0.84 0.78 0.98
38
正态分布拟合优度检验计算表
组限
Oi
Pi
Ei
(0.76 0.79]
1
0.01
1
(0.79 0.82]
4
0.03
3
(0.82 0.85]
7
0.09
9
(0.85 0.88] 22
0.18
18
(0.88 0.91] 24
0.24
24
(0.91 0.94] 24
0.22
22
(0.94 0.97] 10
0.14
27
例:测得某地5801人的ABO血型与MN血型结果如下表。问两种血型系统之间是否有 关联?
ABO 血型
MN血型
M
N MN
合计
O 431 490 902 1823
A 388 410 800 1598
B 495 587 950 2032
AB 137 179 32 348
合计 1451 1666 2684 5801
16
例:用两种检验方法对某食品作沙门氏菌检验,结果如 下表,试比较两种方法的阳性结果是否有差别。
两种检验方法结果比较
常规培养法
荧光抗体法
合计
+
卡方检验讲解
185
300
38.33
7
方法原理
?残差
?设A代表某个类别的观察频数, E代表基于H0计 算出的期望频数, A与E之差被称为残差
?残差可以表示某一个类别观察值和理论值的 偏离程度,但残差有正有负,相加后会彼此 抵消,总和仍然为0。为此可以将残差平方后 求和,以表示样本总的偏离无效假设的程度
8
方法原理
?两组发生率的比较
?实际数据的频数分布和理论假设相同
?理论分布与实际分布的检验
?使用不同的牙膏并不会影响龋齿的发生(两 个分类变量间无关联)
?两变量的相关分析
15
四格表? 2值的校正
?英国统计学家Yates认为,? 2分布是一种连续
型分布,而四格表资料是分类资料,属离散 型分布,由此计算的? 2值的抽样分布也应当
方法原理
?例6.9 用A、B两种方法检查已确诊的乳腺癌 患者140名,A法检出91名(65%),B法检出 77名(55%),A、B两法一致的检出56名 (40%),问哪种方法阳性检出率更高?
A法
+ - 合计
+ 56 (a) 21 (c) 77
B法 -
35 (b) 28 (d) 63
合计
91 49 140
?2.计算概率和确定P值
?本例n = 36 < 40 ,不满足?2检验的应用条件,宜 采用四格表确切概率法。
32
方法原理
?在四格表周边合计不变的条件下,在相应的 总体中进行抽样,四格表中出现各种排列组 合情况的概率
?本例即28、8、22、14保持不变的条件下,若 H0 成立,计算出现各种四格表的概率
效,临床试验结果见表 6.4,问两种药物的疗效有无差异?
表 6.4 两种药物治疗脑动脉硬化的疗效
卡方检验
17
第二节 多个独立样本列联表资料的2检验
18
行×列表资料的2检验
•行×列表基本数据有以下三种情况: 多个样本率比较,有R行2列,称R×2表 ; 两个样本的构成比比较,有2行C列,称2×C表; 多个样本的构成比比较,以及双向无序分类资料关联性检 验,有R行C列,称R×C表。 •行×列表资料2检验的专用公式:
校正公式:
2
( A T 0.5)2 T
2
( ad bc n / 2)2 n (a b)(c d )(a c)(b d )
14
例7-2 某医生欲研究含钙胶囊预防妊高征的效果,将 22~ 33岁单胎初孕妇女具有妊娠高危因素者随机分为两组。含钙 胶囊组42人从孕28周起到分娩止每日口服,结果出现妊高征 3例。安慰剂组29人,结果出现妊高征8例。试问补钙对妊高 征是否具有预防作用?
第七章 2检验
凌莉 教授
医学统计与流行病学系 公共卫生学院
1
主要内容
• 两个独立样本四格表资料的2检验 • 多个独立样本列联表资料的2检验
• 配对设计资料的2检验
• 频数分布拟合优度的的2检验
2
第一节 两个独立样本四格表资料的2检验
3
2分布
•由正态分布构造的一个新的分布,k个独立的标准正态分布变量的平方 和服从自由度为k的2分布。 •2分布形状由自由度v决定: v≤2,曲线呈L形; 随v的增大,曲线趋于对 称;v→∞,曲线趋向正态分布。 •2分布具有可加性:若有k个服从2分布且相互独立的随机变量,则他们 之和仍是2分布,自由度为原来k个自由度之和。 •2分布的界值由自由度v和检验水准α决定。
2.计算检验统计量和自由度
2
( ad bc n 2) 2 n (a b)(c d )(a c)(b d )
第七章 卡方检验
2 校正公式
2 ( ad bc n / 2)2 n
(a b)(c d)(a c)(b d)
2
( A T 0.5)2 T
例 7
例3- 7-3 将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,
两组的缓解率见表7-4。问两疗法的总体缓解率是否不同?
第一节 频数分布拟合优度2 检验
goodness of fit 2 test for frequency distribution
一、χ 2 分布
χ 2分布是一种连续型随机变量的概率分布。
若Zi ~ N (0,1)
,
则称
2
Z12
Z
2 2
Z
2 3
...Biblioteka Z2 v为服从自由度为v 的 2 分布。
观察频数A (2) 2 2 7 17 25 37 25 16 4 1
136(n)
概率P(X) (3)
0.00397 0.01809 0.05801 0.13110 0.20888 0.23468 0.18592 0.10386 0.04090 0.01135
1.000
理论频数T (4)=(3) ×n
27 18
v (3 1)(2 1) 2
P<0.025 , 拒绝H0 ,认为三种剂量镇痛效果有差别.
二、多个率之间两两比较—2 分割法
行×列表资料的2 检验只能得出总的结论:即各总体率或构成比之 间总的来说有差别,但不能说它们彼此之间都有差别。若要进一步解决 此问题,可用2 分割法( partitions of 2 method)。 2 分割原理: (1)n个相互独立的2 分割之和服从2 分布且2总= 2 分割1+ 2 分割2+… (2) ν总=ν分割1+ ν分割2+ … (3)最相近原则分割原表
医学统计学课件卡方检验
队列研究中的卡方检验
总结词
在队列研究中,卡方检验用于比较不同暴露 水平或不同分组在某个分类变量上的分布差 异,以评估暴露因素与疾病发生之间的关系 。
详细描述
队列研究是一种前瞻性研究方法,按照暴露 因素的不同将参与者分为不同的组,追踪各 组的疾病发生情况。通过卡方检验,可以比 较不同暴露水平或不同分组在分类变量上的 分布差异,如分析不同饮食习惯的人群中患
卡方检验与相关性分析的区别
卡方检验主要用于比较实际观测频数与期望频数之间的差异,而相关性分析则用于研究 两个或多个变量之间的关联程度。
卡方检验与相关性分析的联系
在某些情况下,卡方检验的结果可以为相关性分析提供参考,帮助了解变量之间的关联 程度。
05
卡方检验的应用实例
病例对照研究中的卡方检验
总结词
02
公式
卡方检验的公式为 $chi^{2} = sum frac{(O_{ij} - E_{ij})^{2}}{E_{ij}}$,
其中 $O_{ij}$ 表示实际观测频数,$E_{ij}$ 表示期望频数。
03
适用范围
卡方检验适用于两个分类变量的比较,可以用于分析病例对照研究、队
列研究等类型的研究。
卡方检验的用途
如比较不同年龄组、性别组等人群中某种疾病的患病率。
卡方检验的基本假设
每个单元格中的期望 频数应该大于5。
卡方检验对于样本量 较小的情况可能不适 用。
观察频数与期望频数 应该服从相同的概率 分布。
02
卡方检验的步骤
收集数据
01
02
03
确定研究目的
在开始卡方检验之前,需 要明确研究的目的和假设 ,以便有针对性地收集数 据。
第七章 假设检验(F检验与卡方检验)
• F检验
– 方差齐性检验 – 两个独立样本的方差齐性检验
• F检验
– – – – – 提出待检验的假设H0和H1 S12 确定并计算统计量 F S 2 2 根据df1和df2值,对给定的显著性水平α 建立拒绝虚无假设的规则 作出统计决策
• 将检验统计量的值与拒绝规则所指定的临界值相比 较,确定是否拒绝虚无假设
i 1 • 则2服从自由度为n的2(n)分布,记为 2~2(n)。
xi2
2
n
2的特点
• (1) 2是一个正偏态分布,n越大,曲线越趋于对称(趋于 正态分布),n越小,曲线越不对称。 • (2) 2值都是正值。
• (3)若X1,X2,…,Xm相互独立,且Xi~ 2(ni),i=1,2,…,m,则 X=X1+X2+Xm~ 2(n),其中n=n1+n2+…+nm。
性别 男生 女生 合计 录取人数 10(9) 8(9) 18 未录取人数 80(81) 82(81) 162 合计 90 90 180
对平均数差异的显著性检验的理论前提是假设两 个总体的方差是相同,或至少没有显著性差异。 Z检验和t检验 对两个总体的方差是否有显著性差异所进行的检 验称为方差齐性检验,即必须进行F检验。
F分布
• 若有两个服从正态分布的总体N1(μ1,σ1),N2(μ2,σ2)。检 验σ1和σ2是否有显著性差异? • 在方差分析中,需要检验某个因素是否对指标有显著 的作用时需要F分布来解决。 • 设有两个总体X,Y,已知X~2(n1),Y~2(n2),并且 X与Y相互独立,则称随机变量F,所服从的分布为第 一自由度为n1,第二自由度为n2的F分布,记为F~F (n1,n2)。
• • 若自由度df=1,α=0.900,查2分布表可知P(2>0.02)=0.900 记20.900(1)=0.02
理学第七章卡方检验
妇女血型分布构成比不同; =0.05。
2 =211[322/(59 83) +82/(59 27)+ 102/(59 22)+ 92/(59 79) + 512/(152 83)+ 192/(152 27)+ 122/(152 22)+ 702/(152 79) -1]
= 18.77 =(2-1)(4-1)=3
2 =
b+c
(b + c40) (b + c<40)
本例
(10-31)2
2 =
10+31
= 10.76, =1
查表得P 0.005,按=0.05水准,拒绝H0,接受H1,可以认为甲乙两 法的血清学阳性检出率不同。
练习 用两种方法检验已确诊的癌症患者140名。甲法的检出率为65%,乙 法的检出率为55%,甲乙两法一致的检出率为40%。试分析两法的优劣。
115 169
×84, T12 = 54 ×85,
169
T22 =
54 ×84, 169
TRC=
nRnC n
2 = (64- T11)2
T11
(21- T12)2 (51- T21)2
+
T12
+
T21
+
(33- T22)2 T22
=4.13 =(R-1)(C-1)=(2-1)(2-1)=1 2 1,0.05 =3.84, 2 >2 1,0.05 , P<0.05, 拒绝H0。
简化公式: 2 =
(ad-bc)2n (a+b)(c+d)(a+c)(b+d)
ab cd
(四格表专用公式)
2 =211[322/(59 83) +82/(59 27)+ 102/(59 22)+ 92/(59 79) + 512/(152 83)+ 192/(152 27)+ 122/(152 22)+ 702/(152 79) -1]
= 18.77 =(2-1)(4-1)=3
2 =
b+c
(b + c40) (b + c<40)
本例
(10-31)2
2 =
10+31
= 10.76, =1
查表得P 0.005,按=0.05水准,拒绝H0,接受H1,可以认为甲乙两 法的血清学阳性检出率不同。
练习 用两种方法检验已确诊的癌症患者140名。甲法的检出率为65%,乙 法的检出率为55%,甲乙两法一致的检出率为40%。试分析两法的优劣。
115 169
×84, T12 = 54 ×85,
169
T22 =
54 ×84, 169
TRC=
nRnC n
2 = (64- T11)2
T11
(21- T12)2 (51- T21)2
+
T12
+
T21
+
(33- T22)2 T22
=4.13 =(R-1)(C-1)=(2-1)(2-1)=1 2 1,0.05 =3.84, 2 >2 1,0.05 , P<0.05, 拒绝H0。
简化公式: 2 =
(ad-bc)2n (a+b)(c+d)(a+c)(b+d)
ab cd
(四格表专用公式)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 具有可加性。
如何计算理论频数T?
处理 洛赛克 雷尼替丁 合计
愈合
未愈合
合计
64 (57.84) 21 (27.16) 85
51 (57.16) 33 (26.84) 84
115
54
169
合计愈合率:115/169
愈合率(%) 75.29 60.71 68.05
T11=
115 169
×85, T21=
三. Fisher确切概率法 (Fisher’s exact probabilities)
适用于n 40或有T 1时。 基本思想:在四格表周边合计不变的条件下,获得某个四格表 的概率为
(a+b)!(c+d)! (a+c)!(b+d)! P=
a! b! c! d! n!
例
两型慢性布氏病的PHA皮试反应
| P1-P2| 0.267 0.1 0.067 0.233 0.4
P(i)
0.1079
0.0166
极端情况的概率: P=P(0)+ P(4)= 0.1079+0.0166=0.1245 按=0.05水准不拒绝H0,尚不能认为两组发癌率有差别。
第二节 配对四格表资料的 2检验
例6.8 甲法
+ 合计
第一节 四格表(fourfold table)资料的2检验
一.普通2检验
例 6.2
处理 洛赛克 雷尼替丁 合计
表6.2 两种药物治疗消化道溃疡效果
愈合 64 51 115
未愈合 21 33 54
合计 85 84 169
愈合率(%) 75.29 60.71 68.05
解 H0:1= 2; H1:1 2; =0.05
病人分型
阳性数
阴性数
合计
活动型
1(2.4) 14(12.6) 15
稳定型
3(1.6) 7(8.4)
10
合计
4
21
25
阳性率(%) 6.67
30.00 16.00
解 H0:1= 2; H1:1 2; =0.05
表中活动型的阳性率 P1 =0.067,稳定型的阳性率 P2=0.300,
两者差别 | P1-P2| =0.233,该表出现的概率为
115 169
×84, T12 = 54 ×85,
169
T22 =
54 ×84, 169
TRC=
nRnC n
2 = (64- T11)2
T11
(21- T12)2 (51- T21)2
+
T12
+
T21
+
(33- T22)2 T22
=4.13 =(R-1)(C-1)=(2-1)(2-1)=1 2 1,0.05 =3.84, 2 >2 1,0.05 , P<0.05, 拒绝H0。
| P1-P2| 0.400 0.233 0.067 0.100 0.267
P(i) 0.0166 0.1423
0.1079
极端情况的概率: P=P(0)+P(1)+P(4)=0.0166+0.1423+0.1079=0.2668 按=0.05水准不拒绝H0,尚不能认为两型布氏病患者PHA反应阳性率有差别。
补充题:
用某种化学物质进行诱发肿瘤实验,实验组15只小白鼠中 4只发生癌变,对照组10只无1只发生癌变,问两组发癌率 有无差别?
确切概率法计算表(四格表周边合计数不变)
序号(i)
阳性
4 0
0
3 1
1
2 2
2
1 3
3
0 4
4
阴性
11 10 12 9 13 8 14 7 15 6
P1 P2 0.267 0 0.2 0.1 0.133 0.2 0.067 0.3 0 0.4
解: 甲法检出人数
140 0.65=91
乙法检出人数
140 0.55=77
甲、乙两法都检出人数 140 0.40=56
两法检出结果的比较
甲法 +
乙
法
+
-
5635合计 91源自-2128
49
合计
77
63
140
(35 - 21)2
2 =
35+21
= 3.500
按=0.05查表,得2 0.05,1
=3.841, 2 < 2 0.05,1
2 =
b+c
(b + c40) (b + c<40)
本例
(10-31)2
2 =
10+31
= 10.76, =1
查表得P 0.005,按=0.05水准,拒绝H0,接受H1,可以认为甲乙两 法的血清学阳性检出率不同。
练习 用两种方法检验已确诊的癌症患者140名。甲法的检出率为65%,乙 法的检出率为55%,甲乙两法一致的检出率为40%。试分析两法的优劣。
简化公式: 2 =
(ad-bc)2n (a+b)(c+d)(a+c)(b+d)
ab cd
(四格表专用公式)
普通2检验适用条件: n40且所有T 5。
二. 2检验的校正公式
(|A-T|-0.5)2 2 =
T
(n40但有1T5)
简化公式: 2 =
(|ad-bc|-n/2)2n (a+b)(c+d)(a+c)(b+d)
A:实际频数(actural frequency) T:理论频数(theoretical frequency)
(A-T)2 2 =
T
(通用公式)
2 分布的性质
2 分布为连续型分布, 2 自0至,永远大 于0。
2 分布同t分布、F分布一样,也是随自由度 的不同而形成簇状分布。 2 分布的形态随自 由度而变化,自由度越小,偏态越甚;自由度 越大,其分布越趋近于正态分布。
设两样本的差值 | P1-P2| =D,双侧检验取 | P1-P2| D 的各种组合的累计概率为双侧P值;单侧检验取 P1-P2 D或 P1-P2 - D的各种组合的累计概率为单侧P值。若两样本例数 相等,则 P1-P2 D和 P1-P2 - D的P值相等,可先计算一侧
P值,再乘以2得双侧检验的概率。
P=
15! 10! 4! 21!
=0.1423
1! 14! 3! 7! 25!
将该表分解成若干种不同的情况,使得周边数不变:
确切概率法计算表(四格表周边合计数不变)
序号(i)
阳性
0 0
4
1 1
3
2 2
2
3 3
1
4 4
0
阴性
15 6 14 7 13 8 12 9 11 10
P1 P2 0.000 0.400 0.067 0.300 0.133 0.200 0.200 0.100 0.267 0.000
两种血清学检验结果比较
乙
法
+
-
80(a) 31(c)
10(b) 11(d)
111
21
合计
90 42 132
解:H0:两法总体阳性检出率无差别,即B=C; H1:两法总体阳性检出率不同,即BC; =0.05
Tb=Tc=(b+c)/2,
则
(b - c)2
2 =
b+c
, =1
校正公式
(|b - c|-1)2 , =1
如何计算理论频数T?
处理 洛赛克 雷尼替丁 合计
愈合
未愈合
合计
64 (57.84) 21 (27.16) 85
51 (57.16) 33 (26.84) 84
115
54
169
合计愈合率:115/169
愈合率(%) 75.29 60.71 68.05
T11=
115 169
×85, T21=
三. Fisher确切概率法 (Fisher’s exact probabilities)
适用于n 40或有T 1时。 基本思想:在四格表周边合计不变的条件下,获得某个四格表 的概率为
(a+b)!(c+d)! (a+c)!(b+d)! P=
a! b! c! d! n!
例
两型慢性布氏病的PHA皮试反应
| P1-P2| 0.267 0.1 0.067 0.233 0.4
P(i)
0.1079
0.0166
极端情况的概率: P=P(0)+ P(4)= 0.1079+0.0166=0.1245 按=0.05水准不拒绝H0,尚不能认为两组发癌率有差别。
第二节 配对四格表资料的 2检验
例6.8 甲法
+ 合计
第一节 四格表(fourfold table)资料的2检验
一.普通2检验
例 6.2
处理 洛赛克 雷尼替丁 合计
表6.2 两种药物治疗消化道溃疡效果
愈合 64 51 115
未愈合 21 33 54
合计 85 84 169
愈合率(%) 75.29 60.71 68.05
解 H0:1= 2; H1:1 2; =0.05
病人分型
阳性数
阴性数
合计
活动型
1(2.4) 14(12.6) 15
稳定型
3(1.6) 7(8.4)
10
合计
4
21
25
阳性率(%) 6.67
30.00 16.00
解 H0:1= 2; H1:1 2; =0.05
表中活动型的阳性率 P1 =0.067,稳定型的阳性率 P2=0.300,
两者差别 | P1-P2| =0.233,该表出现的概率为
115 169
×84, T12 = 54 ×85,
169
T22 =
54 ×84, 169
TRC=
nRnC n
2 = (64- T11)2
T11
(21- T12)2 (51- T21)2
+
T12
+
T21
+
(33- T22)2 T22
=4.13 =(R-1)(C-1)=(2-1)(2-1)=1 2 1,0.05 =3.84, 2 >2 1,0.05 , P<0.05, 拒绝H0。
| P1-P2| 0.400 0.233 0.067 0.100 0.267
P(i) 0.0166 0.1423
0.1079
极端情况的概率: P=P(0)+P(1)+P(4)=0.0166+0.1423+0.1079=0.2668 按=0.05水准不拒绝H0,尚不能认为两型布氏病患者PHA反应阳性率有差别。
补充题:
用某种化学物质进行诱发肿瘤实验,实验组15只小白鼠中 4只发生癌变,对照组10只无1只发生癌变,问两组发癌率 有无差别?
确切概率法计算表(四格表周边合计数不变)
序号(i)
阳性
4 0
0
3 1
1
2 2
2
1 3
3
0 4
4
阴性
11 10 12 9 13 8 14 7 15 6
P1 P2 0.267 0 0.2 0.1 0.133 0.2 0.067 0.3 0 0.4
解: 甲法检出人数
140 0.65=91
乙法检出人数
140 0.55=77
甲、乙两法都检出人数 140 0.40=56
两法检出结果的比较
甲法 +
乙
法
+
-
5635合计 91源自-2128
49
合计
77
63
140
(35 - 21)2
2 =
35+21
= 3.500
按=0.05查表,得2 0.05,1
=3.841, 2 < 2 0.05,1
2 =
b+c
(b + c40) (b + c<40)
本例
(10-31)2
2 =
10+31
= 10.76, =1
查表得P 0.005,按=0.05水准,拒绝H0,接受H1,可以认为甲乙两 法的血清学阳性检出率不同。
练习 用两种方法检验已确诊的癌症患者140名。甲法的检出率为65%,乙 法的检出率为55%,甲乙两法一致的检出率为40%。试分析两法的优劣。
简化公式: 2 =
(ad-bc)2n (a+b)(c+d)(a+c)(b+d)
ab cd
(四格表专用公式)
普通2检验适用条件: n40且所有T 5。
二. 2检验的校正公式
(|A-T|-0.5)2 2 =
T
(n40但有1T5)
简化公式: 2 =
(|ad-bc|-n/2)2n (a+b)(c+d)(a+c)(b+d)
A:实际频数(actural frequency) T:理论频数(theoretical frequency)
(A-T)2 2 =
T
(通用公式)
2 分布的性质
2 分布为连续型分布, 2 自0至,永远大 于0。
2 分布同t分布、F分布一样,也是随自由度 的不同而形成簇状分布。 2 分布的形态随自 由度而变化,自由度越小,偏态越甚;自由度 越大,其分布越趋近于正态分布。
设两样本的差值 | P1-P2| =D,双侧检验取 | P1-P2| D 的各种组合的累计概率为双侧P值;单侧检验取 P1-P2 D或 P1-P2 - D的各种组合的累计概率为单侧P值。若两样本例数 相等,则 P1-P2 D和 P1-P2 - D的P值相等,可先计算一侧
P值,再乘以2得双侧检验的概率。
P=
15! 10! 4! 21!
=0.1423
1! 14! 3! 7! 25!
将该表分解成若干种不同的情况,使得周边数不变:
确切概率法计算表(四格表周边合计数不变)
序号(i)
阳性
0 0
4
1 1
3
2 2
2
3 3
1
4 4
0
阴性
15 6 14 7 13 8 12 9 11 10
P1 P2 0.000 0.400 0.067 0.300 0.133 0.200 0.200 0.100 0.267 0.000
两种血清学检验结果比较
乙
法
+
-
80(a) 31(c)
10(b) 11(d)
111
21
合计
90 42 132
解:H0:两法总体阳性检出率无差别,即B=C; H1:两法总体阳性检出率不同,即BC; =0.05
Tb=Tc=(b+c)/2,
则
(b - c)2
2 =
b+c
, =1
校正公式
(|b - c|-1)2 , =1