第九章 卡方检验12034 ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
24.08, P0.05
结论与之相反。
二、两相关样本率检验 (McNemar检验)
配对四格表资料的 2 检验
与计量资料推断两总体均数是否 有差别有成组设计和配对设计一样, 计数资料推断两个总体率(构成比) 是否有差别也有成组设计和配对设计, 即四格表资料和配对四格表资料。
例 9-3 某 抗 癌 新 药 的 毒 理 研 究 中 , 将
(2 1 )2 ( 1 )1
以 = 1 查 附 表 8 的 2 界 值 表 得 P 0 . 005 。 按 0 . 05
检 验 水 准 拒 绝 H0, 接 受
H

1









阳性率显著高于健康人,提示可能具有临床诊断价
值。
四格表资料检验的专用公式
2
(adbc)2n
(ab)(ac)(bd)(cd)
表9-3 两种疗法治疗癫痫的效果
治 疗 方 法
治 疗 结 果
有 效
无 效
高 压 氧 组 66( 62.8)
4( 7.2)
常 规 组 38( 41.2)
8( 4.8)
合计 104
12
合 计 有 效 率 ( % )
70 46 116
94.3 82.6 89.7
H 0 :1 2 ,H 1 :1 2 , 0 .0 5
R ×C表 2 检验
行×列表资料
① 多个样本率比较时,有R行2列,称为R ×2表; ② 两个样本的构成比比较时,有2行C列,称
2×C表; ③ 多个样本的构成比比较,以及双向无序分类资
料关联性检验时,有行列,称为R ×C表。
检验统计量
2 n(
A2 1)
nR nC
(行数 1)(列数 1)
a c ac (92) ab cd n
TaT11(ab)n (ac) (93)
TcT21(cd)n (ac) (94)
b d bd (95) ab cd n
TbT 12(ab)n (bd) (96) TdT22(cd)n (bd) (97)
理论频数由下式求得:
TRC
nR nC n
式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
连续性校正。
四格表资料 2 检验公式选择条件:
n40, T5,不校正的理论或专用公
式; n40, 1T5,校正公式;
n40或 T1,直接计算概率。
2 连续性校正仅用于 1的四格表资料,当 2
时,一般不作校正。
例9-2 将116例癫痫患者随机分
为两组,一组70例接受常规加高压氧 治疗(高压氧组),另一组46例接受 常规治疗(常规组),治疗结果见表 7-4。问两种疗法的有效率有无差别?
检验统计量 2 值反映了实际频数与理 论频数的吻合程度。
若检验假设H0:π1=π2成立,四个格子的实际频 数A 与理论频数T 相差不应该很大,即统计量
不应该很大。如果 值2 很大,即相对应的P 值很小,
若 P,则 反过来推断A与T相差太大,超出了抽 样误差允许的范围,从而怀疑H0的正确性,继而 拒绝H0,接受其对立假设H1,即π1≠π2 。
2(331041039)218634.10
7243143114
(四)四格表资料检验的校正公式
c2
( AT 0.5)2 T
(|ad-bc|-n)2n
c2
=
2
(a+b)(c+d)(a+c)(b+d)
2 分布是一连续型分布,而四格
表资料属离散型分布,由此计算得的
2统计量的抽样分布亦呈离散性质。为 改善 2统计量分布的连续性,则进行
一、多个样本率的比较
例9-4用A、B、C三种不同方法分别处理新生儿
脐带,发生感染的情况见表9-6,试比较3种不同方 法的脐带感染率有无差异。
表9-6 三种脐带处理方法的脐带感染情况
处理组
A B C 合计
脐带感染
感染
未感染
76
3143
15
2409
2
762
93
6314
合计
3219 2424 764 6407
=0.05
已知样本四格表中,b=12,c=3,因 b+c=15,故将其代入公式 9-13,有
2 c
(12 3 1)2 12 3
4.27
查附表
8,
2 0.025,1
5.02

2 0.05,1
3.84
,得
0.025<P<0.05,按
=0.05
水准拒绝
H0,接
受 H1,可以认为两种剂量的毒性有差异,甲剂量组的死亡率较高(因 b>c)。
2(3316.6)2(3955.4)2(1026.4)2(10487.6)2
16.6
55.4
26.4
87.6
16.42(161.6551.4261.4871.6)34.32
2(9990.48)2(513.52)2(7583.52)2(2112.48)2
90.48
13.52
83.52
12.48
12.86
表9-8 不同文化程度患者首选疼痛量表的类型
文 化 程 度
高 中 以 下 高 中
高 中 以 上 合 计
V AS 3(3.5) 0(1.6) 4(1.8)
7
首 选 测 痛 量 表
VDS 16(18.7) 10(8.6) 11(9.7)
NRS 18(19.7) 9(9.0) 12(10.2)
37
39
FPS 44(39.0) 18(17.8) 15(20.2)
注意:
本法一般用于样本含量不太大的资料。因 为它仅考虑了两法结果不一致的两种情况(b, c), 而未考虑样本含量n和两法结果一致的两种情况 (a, d)。所以,当n很大且a与d的数值很大(即 两法的一致率较高),b与c的数值相对较小时, 即便是检验结果有统计学意义,其实际意义往 往也不大。
第二节
由公式(9-1)还可以看出: 值2 的大小还取决于 ( A T ) 2
个数的多少(严格地说是自由度ν的大小)。由于各
(
A
T
T
)2
T
皆是正值,故自由度ν愈大, 2 值也会愈大;所以只有考虑
了自由度ν的影响, 值2 才能正确地反映实际频数A和理论频
数T 的吻合程度。
检 2验的自由度取决于可以自由取值的格子
将理论频数太小的行或列与性质相近的邻行或邻列 合并。这样做会损失信息及损害样本的随机性。
注意:不同年龄组可以合并,但不同血型就不能合
并。
➢改用双向无序R×C表的Fisher确切概率法(可用
SAS软件实现)。
(21)(31)2
3.
确定
P
值,下结论。查 2
界值表,
2 0.5,2
1.39 ,
1.018
2 0.5,2
,所以,P>0.50,
以 0.05 水准不拒绝 H0,即尚不能认为两组患者尿路疼痛原因的分布有差异。
三、多组构成比的比较
例9-6 在某项疼痛测量研究中,给160例手术 后疼痛的患者提供四种疼痛测量量表,即 直观模拟量表(VAS),数字评估量表 (NRS),词语描述量表(VDS),面部 表情疼痛量表(FPS),患者首选的量表以 及患者的文化程度见表9-8,问患者首选疼 痛量表与文化程度是否有关?
6( a) 3( c)
12( b) 18( d)
9
30
合计
18 21 39
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能:
①两只大鼠均死亡(甲+乙+)数(a); ②两只均生存(甲-乙-)数(d); ③其中一只死亡(甲+乙- )数(b); ④其中一只死亡(甲-乙+)数 (c)。
本例资料经整理成表9-1形式,即有两 个处理组,每个处理组的例数由发生数和 未发生数两部分组成。表内有33、39、10、 104 四个基本数据,其余数据均由此四个 数据推算出来的,故称四格表资料。
处理组 发生数 未发生数 合计

a
b
a+b

c
d
c+d
合 计 a+c b+d
n
表9-2 四格表资料的基本形式
数目,而不是样本含量n。四格表资料只有
两行两列,=1,即在周边合计数固定的情
况下,4个基本数据当中只有一个可以自由
取值。
(三) 假设检验
(1) 建立检验假设,确定检验水平。
H0:π1=π2 H1:π1≠π2
α=0.05。
(2)求检验统计量值
T 1 1 7 2 4 3 /1 8 6 1 6 .6 , T 1 2 7 2 1 6 .6 5 5 .4 T 2 1 4 3 1 6 .6 2 6 .4 , T 2 2 1 1 4 2 6 .4 8 7 .6 。
78只大鼠按性别、窝别、体重、年龄等因 素配成39对,每个对子的两只大鼠经随机 分配,分别接受甲剂量和乙剂量注射,试 验结果见表9-4。试分析该新药两种不同剂 量的毒性有无差异。
表9-4 某抗癌新药两种剂量的毒理实验结果
甲 剂 量
死 亡 (+ ) 生 存 (- ) 合计
乙 剂 量
死 亡 (+ ) 生 存 (- )
平方。
第一节 2× 2表 2 检验
目的:推断两个总体率(构成比)是 否有差别 (和u检验等价)
要求:两样本的两分类个体数排列成四 格表资料
一、两独立样本率检验 (一)两独立样本率资料的四格表形式
例9-1 为研究肿瘤标志物癌胚抗原(CEA)对
肺癌的诊断价值,随机抽取72例确诊为肺癌的患 者为肺癌组,114例接受健康体检的非肺癌患者为 对照组。用CEA对其进行检测,结果呈阳性反应 者病例组中33例,对照组中10例。问两组人群的 CEA阳性率有无差异?
第九章 卡方检验12034 ppt课件
0.5
0.4
0.3
f ( 2 ) 0.2
0.1
1
6
10
0 0 2 4 6 8 10 12 14 16
2
附表8给出了自由度取不同值时 , 2
分布单侧尾部面积的界值
2
,

它满足条件
P(22,) 01
根据的定义,当自由度 1 时, 2
分布的界值为标准正态分布界值的
表9-1 CEA对两组人群的诊断结果*
分 组 阳 性
阴 性 合 计
肺 癌 组 33( 16.6) 39( 55.4) 72
对 照 组 10( 26.4) 104( 87.6) 114
合计
43
143
186
阳 性 率 ( % ) 45.8 8.8 23.1
* 括号内为理论频数。
(二) 2 检验的基本思想
本例 n116,但 T224.8,故用四格表
资料 2检验的校正公式
c 2(6687 0 4 4 3 6 8 10 14 16 1 2 2 )2 1162.92
1,查 2界值表得 0.0 5P0.1。0按 0.05检验水准不拒绝 H 0 ,尚不能认
为组有效率不等。
本资料若不校正时,
感染率(%)
2.36 0.62 0.26 1.45
二、两组构成比的比较
例9-5为研究某种新药对尿路疼痛的止痛效果, 将有尿路疼痛的患者144例随机分为两组,每组72 例,一组服该新药(治疗组),另一组服安慰剂 (对照组)。两组患者尿路疼痛的原因见表9-7, 问两组患者尿路疼痛原因的分布有无差异?
表9-7 两组患者尿路疼痛原因的分布
分组
治 疗 组 对 照 组 合计
尿 路 感 染 34 29 63
尿 路 疼 痛 原 因 器 械 损 伤 29 35 64
其 它 9 8 17
合 计
72 72 144
2. 求检验统计量和自由度。将表 9-7 数据代入公式 9-14,有
2 144(1)13.40222929222923258 726创3创7创2647217726372647217
77
合 计
81 37 42 160
四、 R ×C表 2 检验的条件
1.行列表中的各格T≥1,并且1≤T< 5的格子数不宜超过1/5格子总数,否
则可能产生偏性。处理方法有三种:
➢ 增大样本含量以达到增大理论频数
的目的,属首选方法,只是有些研究无 法增大样本含量,如同一批号试剂已用 完等。
➢根据专业知识,删去理论频数太小的行或列,或
其中,a, d 为两法观பைடு நூலகம்结果一致的两种情况,
b, c为两法观察结果不一致的两种情况。 检验统计量为
2 (b c)2 , 1
bc
2 c
( b c 1)2 bc
,
=1
H0:总体四格表中甲+乙- 的对子数与甲-乙+的对子数出现频率相同(两剂量毒性相同) H1:总体四格表中甲+乙- 的对子数与甲-乙+的对子数出现频率不同(两剂量毒性不同)
基本思想:可通过 2 检验的基本公式
来理解。
2 (A T )2, (行 数 - 1 )(列 数 1 )
T
式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。
理论频数 是T 根据检验设
率 来估计 而定的。
H0:,1且2用合并
相关文档
最新文档