卡方检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
行×列表资料的χ2检验
注意事项: n>40;T≥1,且1≤T<5的格子数不宜超过格子总数的1/5 -增加样本含量 -删去或合并理论频数太小的行或列 -使用确切概率法 多个样本率比较,若统计推断拒绝H0,只能认为各总体 率之间总的来说有差别,但不能说明任两个样本率之间 皆有差别,需要进一步进行χ2分割
两个独立样本率比较
四格表资料的基本形式
处理组 一 二 合计
发生数 a c
a+c
未发生数
合计
b
a+b
d
c+d
b+d n(a+b+c+d)
χ2检验的基本思想:
考察实际频数(A)与理论频数(T) 的吻合程度
χ2检验的基本思想:
x2
A
T T
2
TRC
nR nC n
df=(r-1)(c-1) A: 实际频数 T: 理论频数
体育课 及格
7 56 32 9 104
良好 8 74
128 13 223
优秀 3 15 17 8 43
合计 22 150 187 36 395
双向无序表基本数据
多个样本率比较时;
两个样本的构成比比较时;
多个样本的构成比比较,以及双向无序 分类资料关联性检验时。
多个样本率比较的χ2分割法
Ⅰ
77
108
185
41.6
Ⅱ
89
103
192
46.4
Ⅲ
99
104
203
48.8
Ⅳ
90
91
181 50.0
合计 355
406
761
46.6
例5-12
不同年龄妇女绝经后出血的病变类型
病变类型,例数(百分比)
年龄组/岁 功能性 恶性 良性 合计
50岁及以下 60 16 59 135
51-
208 111 306 625
n(k 1)
四格表资料的分析原则
1<T ≤5,且n≥40时,用连续性校正χ2检验 T<1,或n<40时,用Fisher确切概率法 其它情况,用Personχ2检验
行×列表资料的χ2检验
2 n( A2 1) nRnc (R 1)(C 1)
例5-10
黑色素瘤患者随访术后3年生存情况 治疗组 3年生存例数 3年死亡例数 合计 3年生存率/%
缓慢型心率
心肌梗塞部位
失常种类 下壁 前壁 真后壁
窦性过缓 8
7
2
被动心率 1
1
0
房室阻滞 6
3
1
束支阻滞 1
16
1
合计
16
27
4
心内膜 下 1 0 1 0 2
合计
18 2 11 18 49
3种药物疗效的观察结果
疗效 治愈 显效 好转 无效 合计
药物
A
B
15
4
49
9
31
50
5
22
100
85
C
合计
1
根据资料特点选择适当的方法,并非所有的行×列表都 能用χ2检验
行×列表的分类及检验方法选择
双向无序 :行列表资料的χ2检验; 单向有序
分组变量是有序的:行列表资料的χ2检验
指标变量是有序的:秩和检验、RIDIT分析等
双向有序属性相同
一致性检验(或称Kappa检验)
双向有序属性不同
差别检验时:秩和检验; 相关分析时:等级相关分析或Pearson相关分析
利用分布的可加性,把表分成多个独立 的四格表进行两两比较
需调整检验水准
χ2 检验的目的
分类数据的差异比较(率或比) 分类数据的关联分析(率或比) 频数分布拟合优度检验
2
(26 21.3)2
(178 182 .7)2
(2 6.7)2
(62 57.3)2
4.84
21.3
182 .7
6.7
57.3
四格表专用公式-独立样本
x
2
a
nad cb d
bc2 a bc
d
N>=40, T>=5
x2 268 26 62 178 22 4.82
20
15
73
45
126
24
51
85
270
眼晶状体浑浊度与年龄的关系
晶状体
年龄
浑浊程度 20~
30~
40~
合计
“+”
215
131
148
494
“++”
67
101
128
296
“+++”
44
63
132
239
合计
326
295
408
1029
学生文化课与体育课成绩的关系
文化课 不及格 及格 良好 优秀 合计
不及格 4 5 10 6 25
61-
66 79 119 264
71-
21 47 43 111
合计 355 253 527 1135
例5-11
Hale Waihona Puke 两种洁肠剂的服后反应 服后反应洁肠剂 无 恶心 呕吐 腹涨 其它 合计 硫酸镁 74 8 4 7 1(1.96) 94 甘露醇 14 21 17 43 3(2.04) 98 合计 88 29 21 50 4 192
+-
-
+
-
-
四格表专用公式-相关样本
差异比较
x 2 b c 2
bc b+c>=40
x 2 b c 12
bc
b+c<40
关联分析
x
2
a
nad cb d
bc2 a bc
d
关联大小
2
n
2 c
2 n
2
V
, k min(R, C)
线性变化趋势:线性趋势χ2检验
某地6094人按2种血型划分的结果
ABO 血型 O A B AB 合计
M
431 388 495 137 1451
MN血型
N
490 410 587 179 1666
MN
902 800 950 325 2977
合计
1823 1598 2032 641 6094
心率失常种类与心肌梗塞部位的关系
204 28 240 64
四格表的连续性校正
xC 2
AT T
0.52
xC2
a
n ad bc n 2 2
cb d a bc
d
N>=40, 1=<Tmin<5
例5-7
两零售点猪肉表层沙门氏菌带菌情况检查结果 沙门氏菌
零售点 阳性 阴性 合计 带菌率/% 甲 2(4.67) 26(23.33) 28 7.14 乙 5(2.33) 9(11.67) 14 35.71 合计 7 35 42 16.67
两个率的比较
两个样本率比较的χ2检验 -两个独立样本率比较 -两个相关样本率比较
例5-6
两种疗法的心血管病病死率比较
疗法 死亡 生存 合计 病死率/%
盐酸苯乙双胍 26(21.3) 178(182.7) 204 12.75
安慰剂 2(6.7) 62(57.3) 64 3.13
合计
28 240 268 10.45
一、 配对四格表资料的χ2检验
甲法
+ 合计
乙法
+
-
a
b
c
d
a+c
b+d
合计
a+b c+d
n
例5-8
某抗癌新药两种剂量的毒理实验结果
乙剂量
甲剂量 死亡(+) 生存(-) 合计
死亡(+) 6
12 18
生存(-) 3
18 21
合计
9
30 39
配对样本的特点
对子中的两个个体的结果组合形式:
AB
++