第七章卡方检验
第七章卡方检验
二、两相关样本率检验(McNemar) 两相关样本率检验(
1.资料类型 1.资料类型 两个相关样本率资料又称配对计数资料,顾名思义, 两个相关样本率资料又称配对计数资料,顾名思义, 是采用配对设计,且结果以频数方式表达的资料, 是采用配对设计,且结果以频数方式表达的资料,见 例 7 -3 。 某抗癌新药的毒理研究中, 78只大鼠按性 例7-3某抗癌新药的毒理研究中,将78只大鼠按性 窝别、体重、年龄等因素配成39 39对 别、窝别、体重、年龄等因素配成39对,每个对子的 两只大鼠经随机分配,分别接受甲剂量和乙剂量注射, 两只大鼠经随机分配,分别接受甲剂量和乙剂量注射, 试验结果见表7 试验结果见表7-4。试分析该新药两种不同剂量的 毒性有无差异。 毒性有无差异。
P <α
理论频数太小的三种处理方法
1.增大样本量. 1.增大样本量. 增大样本量 2.删去理论频数太小的格子所对应的行或列。 2.删去理论频数太小的格子所对应的行或列。 删去理论频并理论频数太小的格子所相邻的行或列。 合并理论频数太小的格子所相邻的行或列
一、多个样本率的比较
例7-4用A、B、C三种不同方法分别处理新 生儿脐带,发生感染的情况见表7 生儿脐带,发生感染的情况见表7-6,试 比较3种不同方法的脐带感染率有无差异。 比较3种不同方法的脐带感染率有无差异。
三、多组百分比的比较
在某项疼痛测量研究中, 160例手术后疼痛 例7-6 在某项疼痛测量研究中,给160例手术后疼痛 的患者提供四种疼痛测量量表,即直观模拟量表( 的患者提供四种疼痛测量量表,即直观模拟量表( VAS),数字评估量表(NRS),词语描述量表( ),数字评估量表 ),词语描述量表 VAS),数字评估量表(NRS),词语描述量表(VDS ),面部表情疼痛量表 FPS) 面部表情疼痛量表( ),面部表情疼痛量表(FPS),患者首选的量表以 及患者的文化程度见表9 及患者的文化程度见表9-8,问患者首选疼痛量表与 文化程度是否有关? 文化程度是否有关?
第七章卡方检验
2.6525 1.5469
Mantel-Haenszel Chi-Square
Phi Coefficient Contingency Coefficient Cramer's V
1
2.6667
0.1025
-0.2887 0.2774 -0.2887
WARNING: 25% of the cells have expected counts less
解答问题的步骤
2.计算检验统计量。
A n( 1) n R nC
2
2 2 2 199 7 26 2 532( 1) 21.04 206 481 206 51 144 51
2
解答问题的步骤
3.查相应界值表,确定P值,下结论。
=(R-1)(C-1)=2,查附表8,
**三、专用公式计算
(A T) T
2 2
组别 A B 合计 结果 阳性 阴性 a b c d a+c b+d 合计 a+b c+d a+b+c+d=N
(ad bc) N (a b)(c d )(a c)(b d )
2 2
(99 21 5 75) 200 12.86 104 96 174 26 两公式比较:计算、应用、含义
一、2检验的基本思想(听懂)
组别 A B 合计
2
结果 阳性 阴性 a b c d a+c b+d
2
合计 a+b c+d a+b+c+d=N
(A T) T
实际频数:A 理论频数:TRC=nrnc/N
卡方检验
计数资料:又称为定性资料或无序分类变量资料,也称 名义变量资料,是将观察单位按某种属性或类别分组计 数,分别汇总各组观察单位数后而得到的资料,其变量 值是定性的,表现为互不相容的属性或类别。
计量资料:又称定量资料或数值变量资料,为观测每个 观察单位某项指标的大小而获得的资料。其变量值是定 量的,表现为数值大小,一般有度量衡单位(cm、mmhg、 次/分、单位等)。
2
(2 1)(2 1) 1
3. 确定P值,作出统计推断
查2界值表,得2 0.005,1=7.88, 2 > 2 0.005,1,P <0.005,按 = 0.05水准,拒绝H0 ,接受H1,差 异有统计学意义,可以认为两组的显效率不等
四格表资料2检验的条件
例:为比较西药与中药治疗慢性支气管炎的疗效,某医师将符合 研究标准的110例慢性支气管炎患者随机分为两组(两组具有可比 性),西药组86例,中药组24例。服药一个疗程后,观察患者的 疗效,结果见下表。根据显效率,该医师认为中西药治疗慢性支 气管炎的疗效有差别,中药组的疗效好于西药组
表1 中西药治疗慢性支气管炎的显效率
等级资料:将观察单位按某种属性或某个标志分组,然 后清点各观察单位个数得来。具有等级顺序。(-、+、++、 +++;治愈、好转、无效、死亡)
独立样本:一般情况下,比较两个(类)人之间的差异 就是独立样本。(实验组、控制组)
配对样本:1. 一个人的不同部位进行测试。2.前测后测 的情况属于相关样本(同一人先后测试a、b两种药物)。 3. 两个匹配样本的比较。(测试两人智力,控制语文成 绩相等)
组别 西药组 中药组 合 计 治疗人数 86 24 110 显效人数 35 18 53 显效率(%) 40.70 75.00 48.18
卡方检验
27
表7 - 8
三种疗法有效率的比较 合计 有效率(%) 有效率(%) 206 182 144 532 96.60 90.11 81.94 90.41
疗法 物理疗法组 药物治疗组 外用膏药组 合计
有效 199 164 118 481
无效 7 18 26 51
28
检验步骤1 检验步骤1-建立假设
H0:三种疗法的有效率相等
免疫荧光法 + -
合计
+
11(a)
12(b)
23
-
2(c)
33(d)
35
合计
13
45
58
20
检验步骤1 检验步骤1-建立假设
H0:两种方法的检测结果相同
H1:两种方法的检测结果不相同
确定检验水准:α = 0.05
21
检验步骤2 检验步骤2-计算检验统计量
(b-c)2 2 未校正计算公式: 未校正计算公式:χ = b+c
P<0.05
结论:在 α = 0.05水准上,拒绝H0,接受H1,可以认 结论: 水准上,拒绝H 接受H 为三种疗法的有效率不全相等(统计学结论),可 ),可 为三种疗法的有效率不全相等(统计学结论), 以认为三种疗法治疗周围性面神经麻痹的有效率有 差别(专业结论)。 差别(专业结论)。
31
多个样本构成比的比较
14
四格表专用公式: 四格表专用公式:
(A−T) χ =∑ T
2
2
2
(ad −bc) N χ = (a +b)(c + d)(a + c)(b + d)
2
(99×21−5×75) ×200 本 : = 例 χ =12.86 104×96×174×26
《卡方检验》课件
制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。
医学统计学--卡方检验
笃 学
精 业
修 德
厚 生
6
2 ( A T ) 2值的大小还取决于 个数的多少(严 T 2 ( A T ) 格地说是自由度 的大小)。由于各 皆是 T 2
正值,故自由度 愈大, 值也会愈大;所以只 2 值才能正确地反映 有考虑了自由度 的影响,
实际频数 A和理论频数 T 的吻合程度。检验时, 要根据自由度 查 2 界值表。当 2≥ 2时, P , ,
2 中,若拒绝无效假设
H0只能做出总的结论,但还不知道哪两
个率之间有差别。若想知道哪两个率之间
有差别,还要进行两两比较,本节介绍两
两比较的方法之一:行×列表的分割。
笃 学
精 业
修 德
厚 生
30
4.行×列表的分割 (一)多个实验组间的两两比较 由于要做重复多次的假设检验,需对第Ⅰ 类错误作校正,新的校正检验水准为:
第七章 掌握内容:
2 检 验
1.检验的基本思想和用途 2.成组设计四格表资料检验的计算及应用条件
3.配对设计四格表资料检验 4.行列表资料检验及应用时应注意的问题 5.频数分布拟合优度的检验 了解内容 1.四格表资料的Fisher精确概率法的基本思想 与检验步骤
笃 学 精 业 修 德 厚 生
2 检验是一种用途很广的假设检验方
处理组 1 2 属性 阳性 阴性 合计
合计
a (T11) c (T21) m1
b (T12) d (T22) m2
n1(固定值) n2(固定值) n
要想知道处理组1,2之间差别是否有统计学意义, 常用 2 检验统计量来作假设检验。
笃 学 精 业 修 德 厚 生
5
卫生统计学第七章卡方检验
卫⽣统计学第七章卡⽅检验⼀、题型:A1题号: 1 本题分数: 2四格表资料两样本率⽐较的χ2检验,正确的⼀项为A. χ2值为两样本率⽐较中u值B. P<α前提下,χ2值越⼤,越有理由拒绝H0C. χ2值⼤⼩与样本含量⽆关D. 每个格⼦的理论频数与实际频数的差值相等E. χ2检验只能进⾏单侧检验正确答案: B答案解析:根据专业知识确定四格表资料两样本率⽐较的χ2检验采⽤单侧检验或是双侧检验, (也可使⽤四格表专⽤公式),可以证明四格表计算得出的χ2值与正态近似法两率⽐较中u值的平⽅相等,其⼤⼩与样本含量有关,且每个格⼦的理论频数与实际频数的差的绝对值相等,P<α前提下,⾃由度⼀定时,χ2值越⼤,P值越⼩,越有理由拒绝H0,故答案为B。
做答⼈数:0做对⼈数:0所占⽐例: 0题号: 2 本题分数: 2下列能⽤χ2检验的是A. 成组设计的两样本均数的⽐较B. 配对设计差值的⽐较C. 多个样本频率的⽐较D. 单个样本均数的⽐较E. 多个样本均数的⽐较正确答案: C答案解析:χ2检验可⽤于率或构成⽐⽐较的假设检验中,不适宜于均数的⽐较。
做答⼈数:0做对⼈数:0所占⽐例: 0题号: 3 本题分数: 2⾏×列表的⾃由度是A. ⾏数-1B. 列数-1C. ⾏数×列数D. (⾏数-1)×(列数-1)E. 样本含量-1正确答案: D答案解析:⾏×列表中,⾏的⾃由度=⾏数-1,列的⾃由度=列数-1,⾏×列⼆维表资料的χ2统计量所对应的⾃由度=(⾏数-1)×(列数-1)。
做答⼈数:0做对⼈数:0所占⽐例: 0题号: 4 本题分数: 2四个百分率做⽐较,有⼀个理论数⼩于5,其他都⼤于5,则A. 只能做校正χ2检验B. 不能做χ2检验C. 直接采⽤⾏×列表χ2检验D. 必须先做合理的合并E. 只能做秩和检验正确答案: C答案解析:四个百分率做⽐较,资料可整理为4×2的⾏×列表,多个率⽐较的⾏×列表资料不适宜采⽤秩和检验,当满⾜⾏×列⼩于5,可直接进⾏χ2检验。
第七章 卡方检验
2 校正公式
2 ( ad bc n / 2)2 n
(a b)(c d)(a c)(b d)
2
( A T 0.5)2 T
例 7
例3- 7-3 将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,
两组的缓解率见表7-4。问两疗法的总体缓解率是否不同?
第一节 频数分布拟合优度2 检验
goodness of fit 2 test for frequency distribution
一、χ 2 分布
χ 2分布是一种连续型随机变量的概率分布。
若Zi ~ N (0,1)
,
则称
2
Z12
Z
2 2
Z
2 3
...Biblioteka Z2 v为服从自由度为v 的 2 分布。
观察频数A (2) 2 2 7 17 25 37 25 16 4 1
136(n)
概率P(X) (3)
0.00397 0.01809 0.05801 0.13110 0.20888 0.23468 0.18592 0.10386 0.04090 0.01135
1.000
理论频数T (4)=(3) ×n
27 18
v (3 1)(2 1) 2
P<0.025 , 拒绝H0 ,认为三种剂量镇痛效果有差别.
二、多个率之间两两比较—2 分割法
行×列表资料的2 检验只能得出总的结论:即各总体率或构成比之 间总的来说有差别,但不能说它们彼此之间都有差别。若要进一步解决 此问题,可用2 分割法( partitions of 2 method)。 2 分割原理: (1)n个相互独立的2 分割之和服从2 分布且2总= 2 分割1+ 2 分割2+… (2) ν总=ν分割1+ ν分割2+ … (3)最相近原则分割原表
次数资料分析---卡方检验
第七章 次数资料分析---χ2检验第一节 χ2检验的原理与方法1.χ2分布χ2分布是从正态分布派生出来的一种分布。
⏹[定义]设X 1,X 2,X 3,…,X n 相互独立同分布,且X i ~N(0,1),则随机变量χ2= x i 2n i=1的分布称为具有n 个自由度的χ2分布。
记作: χ2 = x i 2n i=1 ~χ2(n ) 即:n 个标准正态分布的随机变量的平方和,服从自由度为n 的χ2分布。
⏹[推论]若随机变量X 1,X 2,X 3,…,X n 相互独立,且X i ~N(μ, σ2),则χ2= (x i −μ)2σ2n i=1~χ2(n)⏹[自由度]在计算χ2的过程中,如果有一个统计量代替了其中的一个参数,则其自由度为(n-1);如果有两个统计量代替了其中的两个参数,则其自由度为(n-2)。
χ2= ~χ2(n-1)22212)1()(σσS n x x ni i -=-∑=2.χ2分布的性质⏹χ2分布的“可加性”—在进行χ2统计分析时,可将相邻的数据合并在一起统计⏹χ2分布为非对称的连续性分布,分布区间为[0,+∞]⏹χ2分布曲线因自由度不同而异不同自由度的概率分布密度曲线 2χ 3.χ2检验的基本原理与方法χ2检验是与计数数据相关联的,因而用于计数资料或间断性数据的检验。
⏹[基本原理] 用于实际观测值(O )与理论推算值(E )之间的偏离程度来计算χ2值的大小,根据χ2的概率来检验观测值与理论值的差异程度和符合程度的大小。
⏹[检验方法]按照假设检验的一般步骤,对计数资料进行右尾检验。
如果有k 组资料,则检验统计量的值按下式计算:χ2=(A i −T i )2T iki=1【k:类别;A i :实际观测值;T i :理论推算值】⏹[连续性矫正] 当自由度df ≧2时,一般不作连续性矫正。
但在自由度df =1时,需进行连续性矫正,统计量计算公式:x c2= (∣A i −T i ∣−0.5)2T iki=1第二节 适合性检验1.适合性检验的定义所谓适合性检验,就是检验某一试验结果类别频数的划分是否符合某一理论比例。
医学统计学第七章卡方检验
n 40 或 T 1,直接计算概率。
2 连续性校正仅用于 的1 四格表资料,当
,一般不作校正。
时2
23
第二十三页,共100页
例7-2 某医师欲比较胞磷胆碱与神
经节苷酯治疗脑血管疾病的疗效,将78 例脑血管疾病患者随机分为两组,结果 见表7-3。问两种药物治疗脑血管疾病的
有效率是否相等?
24
阳性 阴性
4
18
5(3) 6
9
24
合计 感染率(%)
22
18.18
11
45.45
33
27.27
39
第三十九页,共100页
一、基本思想
在四格表周边合计数固定不变的条件
下,计算表内4个实际频数变动时的各种
组合之概率 ;再Pi按检验假设用单侧 或双侧的累计概率 ,依P据所取的检验
水准 做出推断。
40
第四十页,共100页
b, c为两法观察结果不一致的两种情况。
检验统计量为
2 (b c)2 , 1
bc
2 c
( b c 1)2 bc
Байду номын сангаас
,
=1
33
第三十三页,共100页
注意:
本法一般用于样本含量不太大的资料。因为
它仅考虑了两法结果不一致的两种情况(b, c),
而未考虑样本含量n和两法结果一致的两种情况
(a, d)。所以,当n很大且a与d的数值很大(即两
1.各组合概率Pi的计算 在四格表周边合计数不 变的条件下,表内4个实际频数 a,b,c,d 变动的 组合数共有“周边合计中最小数+1”个。如例
7-4 , 表 内 4 个 实 际 频 数 变 动 的 组 合 数 共 有 9+1=10个,依次为:
第七章卡方检验报告
H0:两种检验方法的结果相同,即总体B=C; H1:两种检验方法的结果不同,即总体BC。
=0.05。
2
( 26 5 1) 2 26 5
12.90
按 =1查2界值表,P<0.005。在 =0.05水准上拒绝H0 , 接受H1,差异有统计学意义。可认为两法检验结果不同,荧 光抗体法阳性结果高于常规培养法。
24
22 14
(0.97 1.00]
(1.00 1.03] (1.03 1.06] 合计
由 2界值表查得 20.05,1 = 3.84 ,即理论上
如果H0成立,则2有95%的可能 在0~3.84
之间,2 >3.84的可能性只有0.05,是一小概
率事件。
.5
.4
.3
.2
.1
0 0
3.84
四格表资料专用公式:
组别 试验 对照
有效 99 a 75 c
无效 5 b 21 d
合计
有效率%
当b+c≤20时:计算确切概率(利用二项分布
法计算)
例:用两种检验方法对某食品作沙门氏菌检验,结果
如下表,试比较两种方法的阳性结果是否有差别。
两种检验方法结果比较 常规培养法 + 160(a) 5(c) 165 26(b) 48(d) 74
荧光抗体法 + 合计
合计 186 53 239
样本构成比较的比较
例: 某医生分别调查了维吾尔族与回族居民 1513 人和平共处 1355 人, 得其 ABO 血型资料如下表,问两个民族居民血型构成是否相同。 维吾尔族与回族居民 ABO 血型的构成 民族 维吾尔族 回族 合计 A 442 369 811 B 483 384 867 O 416 487 903 AB 172 115 287 合计 1513 1355 2868
第七章 卡方检验
( A − T − 0.5) T
2
•
当自由度大于1时 当自由度大于 时,χ2分布与连续型随 这时, 机变量χ2分布相近似 ,这时,可不作连 续性矫正 , 但要求各组内的理论次数 不小于5。 不小于 。 若某组的理论次数小于5, 若某组的理论次数小于 ,则应把它 与其相邻的一组或几组合并, 与其相邻的一组或几组合并,直到理论 为止。 次数大 于5 为止。
二、 2×2表独立性检验 × 表
•
在做2× 表的独立性检验时 表的独立性检验时, ( 在做 ×2表的独立性检验时,df=(21)(2-1)=1,故计算χ2时需做连续性矫正。 故计算χ ) 故计算 时需做连续性矫正。 一般形式如下: 一般形式如下: • 2×2列联表一般形式 × 列联表一般形式 列 行 1 2 总数 1 O11 O21 C1 2 O12 O22 C2 总 数 R1 R2 n
数与理论次数差异不显著; 数与理论次数差异不显著; 差异不显著
2 χ02.05 ≤ χ2(或 χ c2 )< χ0.01 ,0.01< P ≤0.05ቤተ መጻሕፍቲ ባይዱ • 若 < ,
表明实际观察次数与理论次数差异显著; 表明实际观察次数与理论次数差异显著; 差异显著
2 • 若χ2( 或 χ c2 )≥ χ0.01 , P ≤0.01,表明实际观察 , 次数与理论次数差异极显著 差异极显著。 次数与理论次数差异极显著。
•
•
t检验主要用于两样本平均数(或 检验主要用于两样本平均数( 检验主要用于两样本平均数 一个样本平均数与总体平均数) 一个样本平均数与总体平均数)间 的差异显著性检验; 的差异显著性检验; F检验主要应用于样本平均数的个 检验主要应用于样本平均数的个 检验 数大于或等于3时的假设检验 时的假设检验。 数大于或等于 时的假设检验。
卡方检验的解释
卡方检验是一种统计检验方法,用于比较两个或多个分类变量之间的差异是否具有统计学意义。
它主要用于推断两个分类变量之间是否存在关联或独立性。
卡方检验的原理是通过比较实际观察到的频数与期望频数之间的差异来判断两个变量之间是否存在显著的关联。
在卡方检验中,首先计算每个单元格中的实际频数与期望频数之间的差异,然后将这些差异平方后相加,得到卡方值。
最后,根据卡方分布的概率密度函数来确定卡方值是否落在拒绝域内,从而判断两个变量之间的关联是否具有统计学意义。
卡方检验可以用于多种情况,如检验两个分类变量之间是否存在关联、检验多个分类变量之间的独立性、检验频数分布的拟合优度等。
在实际应用中,需要根据具体问题选择合适的卡方检验方法,并结合样本大小和显著性水平来判断结果的可靠性。
需要注意的是,卡方检验的前提是样本必须是随机样本,并且每个单元格中的频数不应过小。
如果样本不满足这些条件,可能会导致卡方检验的结果不准确。
此外,卡方检验只是一种统计推断方法,不能证明因果关系的存在,需要结合实际情况进行综合分析。
医学统计学课件卡方检验
队列研究中的卡方检验
总结词
在队列研究中,卡方检验用于比较不同暴露 水平或不同分组在某个分类变量上的分布差 异,以评估暴露因素与疾病发生之间的关系 。
详细描述
队列研究是一种前瞻性研究方法,按照暴露 因素的不同将参与者分为不同的组,追踪各 组的疾病发生情况。通过卡方检验,可以比 较不同暴露水平或不同分组在分类变量上的 分布差异,如分析不同饮食习惯的人群中患
卡方检验与相关性分析的区别
卡方检验主要用于比较实际观测频数与期望频数之间的差异,而相关性分析则用于研究 两个或多个变量之间的关联程度。
卡方检验与相关性分析的联系
在某些情况下,卡方检验的结果可以为相关性分析提供参考,帮助了解变量之间的关联 程度。
05
卡方检验的应用实例
病例对照研究中的卡方检验
总结词
02
公式
卡方检验的公式为 $chi^{2} = sum frac{(O_{ij} - E_{ij})^{2}}{E_{ij}}$,
其中 $O_{ij}$ 表示实际观测频数,$E_{ij}$ 表示期望频数。
03
适用范围
卡方检验适用于两个分类变量的比较,可以用于分析病例对照研究、队
列研究等类型的研究。
卡方检验的用途
如比较不同年龄组、性别组等人群中某种疾病的患病率。
卡方检验的基本假设
每个单元格中的期望 频数应该大于5。
卡方检验对于样本量 较小的情况可能不适 用。
观察频数与期望频数 应该服从相同的概率 分布。
02
卡方检验的步骤
收集数据
01
02
03
确定研究目的
在开始卡方检验之前,需 要明确研究的目的和假设 ,以便有针对性地收集数 据。
最新-11-09 第七章 卡方检验2课件ppt
第三节
四格表资料的Fisher确切概率法
条件:
理论依据:超几何分布
(非χ2 检验的范畴)
例7-4 某医师为研究乙肝免疫球蛋白 预防胎儿宫内HBV感染的效果,将33例 HBsAg阳性孕妇随机分为预防注射组和非预 防组,结果见表7-4。问两组新生儿的HBV 总体感染率有无差别?
一、基本思想
在四格表周边合计数固定不变的条件 下,计算表内4个实际频数变动时的各种组
二、检验步骤(本例n=33<40 )
H0:1=2,即两组新生儿HBV的总体感染率相等 H1:1≠2,即两组新生儿HBV的总体感染率不等
α =0.05 1.计算现有样本四格表的P*及各组合下四格表的Pi ,见表7-5。本例P*=0.08762728。
2.计算满足Pi≤P*条件的所有四格表的累计概率P。
病种
阳性
阴性
合计
胆囊腺癌
6
胆囊腺瘤
1
合计
7
4
10
9
10
13
20
H0:1=2,即胆囊腺癌与胆囊腺瘤的P53基因表达
阳性率相等
H1:1≠2,即胆囊腺癌与胆囊腺瘤的P53基因表达
阳性率不等 α=0.05 本例 a+b=c+d=10,由表7-7可看出,四格表内各种 组合以i=4和i=5的组合为中心呈对称分布。
表组合的累计概率为左侧概率,记为PL;现 有样本四格表及其以右的所有四格表组合的 累计概率为右侧概率,记为PR。若备择假设
H1为12,则P单侧=PR;若H1为12,则
P单侧=PL。
(2)双侧检验 计算满足Pi ≤ P*条件的各种组合下四格表
的累计概率。若遇到 a+b=c+d 或 a+c=b+d 时 ,四格表内各种组合的序列呈对称分布,此 时按单侧检验规定条件只计算单侧累计概率 ,然后乘以2即得双侧累计概率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
=3.841, 2 < 2 0.05,1
,故不能拒绝H0 ,
不能认为两法的检出率有差异。
第三节 行列表的2检验
行列表包括2 2、R 2、2 C、R C表等。
A2
2 = n( nr nc - 1)
适用条件:不能有T 1,并且 1T <5的格子数不超过总格 子数的1/5。
+ 合计
两种血清学检验结果比较
乙
法
+
-
80(a) 31(c)
10(b) 11(d)
111
21
合计
90 42 132
解:H0:两法总体阳性检出率无差别,即B=C; H1:两法总体阳性检出率不同,即BC; =0.05
Tb=Tc=(b+c)/2,
则
(b - c)2
2 =
b+c
, =1
校正公式
(|b - c|-1)2 , =1
第七章 2检验 (Chi-square test)
用于:
– 对多个独立样本率的比较,也适用于两个率 的比较;
– 对多组构成比的比较; – 对按照两个变量分组的资料,检验此两变量
的关系; – 对频数分布做拟合优度检验。
第一节 四格表(fourfold table)资料的2检验
一.普通2检验
例 6.2
处理 洛赛克 雷尼替丁 合计
表6.2 两种药物治疗消化道溃疡效果
愈合 64 51 115
未愈合 21 33 54
合计 85 84 169
愈合率(%) 75.29 60.71 68.05
解 H0:1= 2; H1:1 2; =0.05
A:实际频数(actural frequency) T:理论频数(theoretical frequency)
×84,
T12 = 54 ×85,
169
T22 =
54 ×84, 169
TRC=
nRnC n
2 = (64- T11)2
T11
(21- T12)2 (51- T21)2
+
T12
+
T21
+
(33- T22)2 T22
=4.13 =(R-1)(C-1)=(2-1)(2-1)=1 2 1,0.05 =3.84, 2 >2 1,0.05 , P<0.05, 拒绝H0。
13(9.2) 12(10.6) 2(2.8) 44
10(7.6) 8(8.8) 2(2.2) 35
11(10.3) 23(11.9) 5(3.1) 49
43
53
14
219
年龄/岁 11-30 31-50 50以上 总和
治愈 67 32 10 109
显效 9 23 11 43
好转 10 20 23 53
同
2 = (20 25-10 7)2 62 =12.636
30 32 27 35
查表得P 0.005,按=0.025水准拒绝H0,接受H1,可以认为复方降压片的有效率显
著地高于安慰剂。
2.多组间的两两比较
´=
C2 k
例 对前例资料进行两两比较 ´= 0.05 =0.0167 3
2 = (35 10 - 5 20)2 70
40 30 55 15
=4.419
查表得P >0.025,按=0.0167水准不能拒绝H0,不能认为两药的疗效不同。
三.多个构成比的比较
例 欲了解女性血栓形成患者的血型分布是否与正常妇女有所不同,资料见 表,试分析血栓形成患者与正常妇女血型分布构成比有无差别?
(A-T)2 2 =
T
(通用公式)
2 分布的性质
2 分布为连续型分布, 2 自0至,永远大 于0。
2 分布同t分布、F分布一样,也是随自由度 的不同而形成簇状分布。 2 分布的形态随自 由度而变化,自由度越小,偏态越甚;自由度 越大,其分布越趋近于正态分布。
2 具有可加性。
简化公式: 2 =
(ad-bc)2n (a+b)(c+d)(a+c)(b+d)
ab cd
(四格表专用公式)
普通2检验适用条件: n40且所有T 5。
二. 2检验的校正公式
(|A-T|-0.5)2 2 =
T
(n40但有1T5)
简化公式: 2 =
(|ad-bc|-n/2)2n (a+b)(c+d)(a+c)(b+d)
P=
15! 10! 4! 21!
=0.1423
1! 14! 3! 7! 25!
将该表分解成若干种不同的情况,使得周边数不变:
确切概率法计算表(四格表周边合计数不变)
序号(i)
阳性
0 0
4
1 1
3
2 2
2
3 3
1
4 4
0
阴性
15 6 14 7 13 8 12 9 11 10
P1 P2 0.000 0.400 0.067 0.300 0.133 0.200 0.200 0.100 0.267 0.000
解: 甲法检出人数
140 0.65=91
乙法检出人数
140 0.55=77
甲、乙两法都检出人数 140 0.40=56
两法检出结果的比较
甲法 +乙法Fra bibliotek+
-
56
35
合计 91
-
21
28
49
合计
77
63
140
(35 - 21)2
2 =
35+21
= 3.500
按=0.05查表,得2 0.05,1
40 32 42 30
H1:复方哌唑嗪与安慰剂的有效率不 =31.500
查表得P 0.005,按=0.025水准拒绝H0,接受H1,可以认为复方哌唑嗪的有效率
显著地高于安慰剂。
(2)复方降压片与安慰剂的比较
组别
有效
无效
复方降压片
20
10
安 慰剂
7
25
合计
27
35
合计
30 32 62
H0:复方降压片与安慰剂的有效率相同; H1:复方降压片与安慰剂的有效率不
复方哌唑嗪与安慰剂比较的2 =31.500,复方降压片与安慰剂比较的
2 =12.636,按´=0.0167都应拒绝H0,结论同前。
在多组间的两两比较中,还需进行复方哌唑嗪与复方降压片的比较。
组别
有效
无效
合计
复方哌唑嗪 35
复方降压片 20
合计
55
5
40
10
30
15
70
H0:复方哌唑嗪与复方降压片的有效率相同; H1:复方哌唑嗪与复方降压片的有效率不同。
| P1-P2| 0.267 0.1 0.067 0.233 0.4
P(i)
0.1079
0.0166
极端情况的概率: P=P(0)+ P(4)= 0.1079+0.0166=0.1245 按=0.05水准不拒绝H0,尚不能认为两组发癌率有差别。
第二节 配对四格表资料的 2检验
例6.8 甲法
| P1-P2| 0.400 0.233 0.067 0.100 0.267
P(i) 0.0166 0.1423
0.1079
极端情况的概率: P=P(0)+P(1)+P(4)=0.0166+0.1423+0.1079=0.2668 按=0.05水准不拒绝H0,尚不能认为两型布氏病患者PHA反应阳性率有差别。
无效 5 4 5 14
总和 91 79 49 219
练习 某医院研究急慢性白血病与血型之间有无关系,资料见下 表,问白血病的种类与患者血型的型别之间有无关联性?
补充题:
用某种化学物质进行诱发肿瘤实验,实验组15只小白鼠中 4只发生癌变,对照组10只无1只发生癌变,问两组发癌率 有无差别?
确切概率法计算表(四格表周边合计数不变)
序号(i)
阳性
4 0
0
3 1
1
2 2
2
1 3
3
0 4
4
阴性
11 10 12 9 13 8 14 7 15 6
P1 P2 0.267 0 0.2 0.1 0.133 0.2 0.067 0.3 0 0.4
设两样本的差值 | P1-P2| =D,双侧检验取 | P1-P2| D 的各种组合的累计概率为双侧P值;单侧检验取 P1-P2 D或 P1-P2 - D的各种组合的累计概率为单侧P值。若两样本例数 相等,则 P1-P2 D和 P1-P2 - D的P值相等,可先计算一侧
P值,再乘以2得双侧检验的概率。
正常妇女与血栓形成者的血型分布表
分组
A型
B型
AB型
O型
合计
血栓形成组 32
8
正常妇女组 51
19
合计
83
27
10
9
59
12
70
152
22
79
211
H0:血栓形成患者与正常妇女血型分布构成比相同;H1:血栓形成患者与正常
妇女血型分布构成比不同; =0.05。
2 =211[322/(59 83) +82/(59 27)+ 102/(59 22)+ 92/(59 79) + 512/(152 83)+ 192/(152 27)+ 122/(152 22)+ 702/(152 79) -1]
P值在0~1之间,0表示完全无关,1表示完全相关。