医学统计学--卡方检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
无效
51
49
35
45
59
15
145
109
合计 100 80 74 254
32
经过总的假设检验,拒绝了H0,因此,可进一步作两两
比较。
对比组 西药组 中药组
合计 西药组 中西药结合组
合计 中药组 中西药结合组
表 三种疗法效率的两两比较
有效
无效
合计 2 值
51 35
49 45
100 80
0.94
86
若检验假设 成立,实际频数与理论频数T的差值会小,则 值H也0会
小;反之,若检验假设 不成立,实际频数与理论频数的差2 值会大,
则 值也会大。
H0
2
6
值2的大小还取决于
个数( A的多T少) 2(严格地说是自由度
T
的大小)。由于各
皆是正值,故自由度 愈( 大A ,T )值2 也会愈
大;所以只有考虑了自由度 的影响2, 值才能正确地T 反映实际频
17
表7-2 两个变量阳性率比较的一般形式和符号
变量1 阳性 阴性
变量2
阳性
阴性
a
b
c
d
合计
变量1的阳性率= 变量2的阳性率=
m1
= n1 n
= m1 n
m2
ab
n
ac
n
合计
n1 n2
n (固定值)
18
变量1的阳性率-变量2的阳性率
ab
=
-
n
ac
=
n
bc n
c 可见,两个变量阳性率的比较只和 、 有关,b而与 、
的Fisher确切概率法。
3.作出统计结论
以 =1查 界值表2 ,若
,按P 0.05检验水准拒0绝.05 ,
接受 ,可认为两总H体0 率不同;H若1
,按检验水准
不拒绝 ,P尚不0.能05认为两总体率不同。 0.05
H0
10
两样本率比较的资料,既可用 检验也可用u 检验来
推断两总体率2 是否有差别,且在不校正的条件下两种检验
b
(T12)
d
(T22)
m2
n1(固定值) n2(固定值)
n
要想知道处理组1,2之间差别是否有统计学意义,常用 检验统计
量来作假2设检验。
5
其基本公式为:
2
(A T)2 T
(7.1)
由公式(7.1)可以看出: 值反映了2实际频数与理论频数的吻合
程度,其中
反映了某个格子实际( A频数T与) 2理论频数的吻合程度。
2 (| 22 6 | 1)2 8.04
22 6
23
3. 作出统计推断 ……
24
第三节 行×列表的χ2检验 行×列表资料的检验,用于多个样本率的比较、两 个或多个构成比的比较、以及双向无序分类资料的关联 性检验。其基本数据有以下3种情况:
25
第三节 行×列表的χ2检验
①多个样本率比较时,有R行2列,称为 表; R 2
2
第一节 四格表资料的2 检验 一、检验的基本思想
以两样本率比较的 检验为例2 ,介绍 检验的基本思想2。
分2 布是一种连续型分布 ,它的形状依赖于自由度 的大小,
当自由度 ≤2时,曲线呈L型;随着 的增加,曲线逐渐趋于对称; 当自由度→∞时, 分布趋向正态分布。 分布具有可加性。
2
2
bc
bc
2
2
化简后得到,2 统计量的计算公式为:
2 (b c)2
bc
20
若 b c , 4需0对上述公式校正, 校正公式为:
2 (| b c | 1) 2
bc
21
例 某研究室用甲乙两种血清方法检查鼻咽癌患者血清93份, 结果如下表,问两法的检出率有无差别?
28
(二).多个样本率比较,若所得统计推断为拒绝H0,接受 H1时,只能认为各总体率之间总的来说有差别,但不能说 明任两个总体率之间皆有差别。要进一步推断哪两总体率 之间有差别,需进一步做多个样本率的多重比较。
29
4.行×列表的分割
在行×列表的 中,若2 拒绝无效假设H0只能做出总的
结论,但还不知道哪两个率之间有差别。若想知道哪两 个率之间有差别,还要进行两两比较,本节介绍两两比 较的方法之一:行×列表的分割。
14(11.16)
旧
10(7.16) 18(20.84)
合计
11
32
合计
15 28 43
14
本例n>40,因有一格子的理论数<5,因而要用校正 检验。
2
H0:两组工人皮肤炎总体患病率相等,即
1 2
H1:两组工人皮肤炎总体患病率不等,即
0.05
1 2
校正 值2为:
2 (|1 3.84 | 0.5)2 (|14 11.16 | 0.5)2
30
4.行×列表的分割
(一)多个实验组间的两两比较
由于要做重复多次的假设检验,需对第Ⅰ类错误作校正, 新的校正检验水准为:
,
N
N k (k 1) 2
31
例:某医师分别用西药,中药和中西药结合治疗恶 性肿瘤,结果如下表:
表
对比组 西药组 中药组 中西药结合组
合计
三种疗法效率
有效
用专用公式:
2
(ad bc)2 n
(29 28 7 9)2 73
(a b)(c d )(a c)(b d ) 36 37 38 35
23.12
下结论:
以 =1查 界值表2 ,
,P按 0.05 检验水准拒0.绝05 ,
接受 ,可认为H两0总体率不同H;1
方法是等价的,对同一份资料有
。
u2 2
11
例 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人 组和对照组的尿液作尿棕色素定性检查,结果见下表,问铅中 毒病人与对照人群的尿棕色素阳性率差别有无统计学意义?
组别
铅中毒病人 对照组 合计
表 两组人群尿棕色素阳性率比较
阳性数
阴性数
合计
(18.74)
94
180
51
49
100
59
15
74
15.10
110
64
174
35
45
80
59
15
74
20.93
P值 >0.017
<0.017
<0.017
合计
94
60
154
33
(二)多个实验组与一个对照组的比较 此时,校正的检验水平为:
k 1
34
The End
35
nR nC
1. 多个率的比较
例
2. 多个构成比的比较
例
27
3. 行×列表资料 检验的2 注意事项
(一).一般认为,行×列表中的理论频数不应小于1,或 的格子数不宜超过格子1 总T数的5 。若出现上述情况,可通过 以下方法解1 /决5:①最好是增加样本含量,使理论频数增大; ②根据专业知识,考虑能否删去理论频数太小的行或列,能 否将理论频数太小的行或列与性质相近的邻行或邻列合并; ③改用双向无序表的Fisher确切概率法(可用SAS软件实现)。
ad
无关。
H 0: B ,C即两种方法的总体检测结果相同
H1: B ,C即两种方法的总体检测结果不相同
0.05
19
若H0 成立,变量1与变量2所示的结果不一致的两个格子理论频数
都应该是
。由2 检验基本思(b想得c):/ 2
[b b c ]2 [c b c ]2
2
数 和理论频数 的吻合程度。检验时2,要根据自由度 查 界值
表。当 ≥ A时, 拒绝 ,接T 受 ;当
时, ,尚
没有理由拒绝 。 而自由度2 。
2
2 ,
P ,
H0
H1
H0
2
2 ,
1
P
7
二、 检2验的检验步骤 1.建立检验假设
H:0 1 ,两2 总体率相等 H:1 1 ,两2 总体率不等
(17.26)
29
7
36
(19.26)
(17.74)
9
28
37
38
35
73
阳性率 (%) 80.56
24.32
52.05
12
2 (29 18.74)2 (7 17.26)2 (9 19.26)2 (28 17.74)2
18.74
17.26
19.26
17.74
23.12
甲法
+ - 合计
表 两种血清学检查结果比较
乙法
+
-
45
22
6
20
51
42
合计
67 26 93
22
1. 建立假设检验,确定检验水准。 H 0: B ,C即两种方法的总体检测结果相同
H1: B ,C即两种方法的总体检测结果不相同
0.05
2. 计算统计量
由于 b c 2,8需作4连0续性校正,计算卡方值:
2
3
表7-1 完全随机设计两样本率比较的四格表
处理组
1 2 合计
阳性
A11 A21
(T11) (T21)
m1
属性
阴性
A12 A22
(T12) (T22)
m2
合计
n1(固定值) n2(固定值)
n
4
表7-1 完全随机设计两样本率比较的四格表
处理组
阳性
属性
阴性
合计
1 2 合计
a (T11) c (T21) m1
13
例2 某矿石粉厂生产一种矿石粉时,在数天内即有部分工人患有职业性皮肤炎。后随机抽取15名工 人穿新防护服,其余仍穿原用的防护服,一个月后检查两组工人的皮肤炎患病情况,资料见下表, 问两组的患病率差别有无统计学意义?
表 穿新旧防护服工人的皮肤炎患病比较
防护服种类
皮肤炎症
阳性数
阴性数
新
1(3.84)
②两个样本的构成比比较时,有2行C列,称为 表;
2C
③多个样本的构成比比较,以及双向无序分类资料关联性检验时,有
R行C列,称为
表。
以上3种情况可统称为行×列表资料。
RC
26
行×列表资料的 检验仍2 可用Pearson 公式,但用下2列专用
公式,计算简单,
2 n(
A2 1) , (行数-1)(列数-1)
40检验水准拒绝接受可认为两总体率不按检验水准不拒绝笃笃学学厚厚生生11两样本率比较的资料既可用检验也可用检验来推断两总体率是否有差别且在不校正的条件下两种检验方法是等价的对同一份资料有笃笃学学厚厚生生为了解铅中毒病人是否有尿棕色素增加现象分别对病人组和对照组的尿液作尿棕色素定性检查结果见下表问铅中毒病人与对照人群的尿棕色素阳性率差别有无统计学意义
注意:本例若不作连续性校正,则
,得2 4.33
P 0.05 ,可见两者是有区别的。
16
第二节 配对四格表资料的2检验
属于配对设计的两组频数分布的2检验。这类问题的原
始数据可以表示为表7-2所示的四格表形式。表7-2和表7-1的 区别仅在设计上,前面是两个独立样本,行合计是事先固定 的;而这里的“两份样本” 互不独立,样本量都是n,是固 定的,而行合计与列合计却是事先不确定的。
时:用1四 T格表5资
料 检验的校正公式;或改2用四格表资料的Fisher确切概率法。
校正公式 校正公式
2 c
( A T 0.5) 2 T
c
2=
(a
(|a
d
-b
c|-
n 2
)2
n
+b)(c+d)(a+c)(b
+d)
9
(3)当 n ,4或0 时T,不1能用 检验,改用四2 格表资料
0.05
2.计算检验统计量 (1)当总例数大于40且所有格子的理论数大于5时:用检验 的基本公式或四格表资料检验的专用公式;
基本公式
2
(AHale Waihona Puke T)2 T8专用公式
2
(ad bc) 2 n
(a b)(c d )(a c)(b d )
(2)当总例数 n且只4有0一个格子的
第七章 2 检 验
掌握内容: 1.检验的基本思想和用途 2.成组设计四格表资料检验的计算及应用条件 3.配对设计四格表资料检验 4.行列表资料检验及应用时应注意的问题 5.频数分布拟合优度的检验
了解内容 1.四格表资料的Fisher精确概率法的基本思想与检验步骤
笃学
精业
修德
厚生
1
2 检验是一种用途很广的假设检验方法。本章只介绍 它在分类变量资料中的应用,即推断两个及多个总体率或 总体构成比之间有无差别,两种属性或两个变量之间有无 关联,以及频数分布的拟合优度检验等。
3.84
11.16
(|10 7.16 | 0.5)2 (|18 20.84 | 0.5)2
7.16
20.84
2.94
15
以 =1查 界值 表2 ,
,P按 0.05 检验水 准 不0.0拒5绝 ,
接受 ,尚不能认H为穿0 不同防护H服1的两组工人的皮肤炎患病率
的差别有统计学意义;