四格表卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3)当n<40或T<1时,用Fisher精确检验(Fisher exact test )
2分布是一连续型分布,而四格表资料属离散型
分 布 , 对 其 进 行 校 正 称 为 连 续 性 校 正 (correction for continuity), 又 称 Yates 校 正 ( Yates' correction)。
четверг, 2
(3) 2检验
从菜单选择 Analyze→Descriptive
Statistics→Crosstable(交叉表) 指定 Row(s):组别 Columns(s):效果 击Statistics按钮选择Chi-square。
четверг, 2
输出结果
четверг, 2
结果分析
检验统计量 2 值:
2R,C(A rcTrc)2 ( AT) 2
T r,c1
rc
T
четверг, 2
2(27125.324)2(522.76)2(7491.76)2
25.324
22.76
91.76
(268.24)256.77 8.24
df(21)(21)1
Pearson 2 值近似服从自由度为 df=(R-1)(C-1)的 2 分布
本章结构
第一节 四格表 2检验
第二节 四格表确切概率法
第三节 R×C 表资料的 2检验
第四节 配对四格表资料的 McNemar检验
第五节 多个样本率的两两比较
четверг, 2
第一节 四格表 2检验
卡方检验的基本思想 四格表专用公式 四格表卡方检验的应用条件 校正卡方检验
четверг, 2
2 检验
четверг, 2
2. spss操作过程
(1)在spss中调出数据文件Li8-2.sav (2)频数变量加权。 从菜单选择 Data→Weight Cases 弹出Weight Cases对话框,选择
Weight Cases by框,框内选入“频数 ”,即指定该变量为频数变量
четверг, 2
由总频数n=37<40,使用Fisher Exact Test(Fisher精确检验)。
由Fisher精确检验双侧P= 0.001 <0.05 ,以α=0.05水准拒绝H0,差异有统计学 意义,可以认为红花散能够改善周围血 管闭塞性病变患者的皮肤微循环状况。
четверг, 2
表8-4 两组疗效比较
疗法
有效
无效
合计
通塞脉1号
26
7
33
活血温经汤
36
2
38
合计
62
9
71
четверг, 2
例8-2 对表8-4资料推断两组的疗效有无差别
(1) H0: 1 2 ,即两组疗效相同
H1: 1 2 ,即两组疗效不同 , α=0.05
(2)计算2值,最小理论数
933
T12
4.18 71
четверг, 2
列联表分析
четверг, 2
统计量
卡方 检验
一致性检验 危险度分析
配对四格表卡 方检验
четверг, 2
主要输出结果
校正只适用于四格表 理论数小于5的格子数为0(占0%),最小理论数为8.24
четверг, 2
结果分析
由总频数n=376>40,最小理论频数8.24 >5,使用Pearson卡方检验。
校正卡方检验2 =2.746,P=0.098,不能认为两药疗效不同。
четверг, 2
第二节 四格表确切概率法
四格表确切概率法基本思想 实例
четверг, 2
➢四格表资料:当①总例数n<40; ➢②用其他方法所得概率接近检验水准α; ➢③四格表中有实际频数A=0; ➢④四格表中有理论频数T<1。 ➢应采用四格表确切概率法。四格表确切概率法 系英国统计学家Fisher于1934年提出,又称 Fisher精切概率法(Fiser s exact test)
четверг, 2
四、连续性校正公式
校正公式:
2 (AT0.5)2, T
2 (ad bc n/2)2n
(ab)c (d)a (c)b (d)
четверг, 2
校正 2 检验
例8-2 某中医院将71例血栓闭塞性脉管炎Ⅲ 期2~3级患者随机分为两组,分别用活血温经汤 和通塞脉1号治疗。结果如表8-4,推断两药疗效 有无差别。
的“行×列表”资料。
четверг, 2
二、四格表专用公式
为了不计算理论频数T, 可由基本公式推导出,
直接由各格子的实际频数(a、b、c、d)计算卡方 值的公式:
基 本 公2式 : (AT)2
T
(adb)c2n
(ab)(cd)(ac)(bd)
df1
-------四格表专用公式
четверг, 2
четверг, 2
例8-3 研究中药制剂红花散改善周围血管闭 塞性病变患者的皮肤微循环状况,以安慰剂作对 照,将37个病例随机分到两组,结果如表8-5 , 分析红花散的疗效。
表8-5 红花散改变缺血组织皮肤微循环资料
组别
改善
无效
合计
红花散
15
5
20
安慰剂
3
14
17
合计
18
19
பைடு நூலகம்
37
четверг, 2
H0:红花散无效, H1:红花散有效 。α=0.05 n=37<40 采用四格表确切概率法。Spss操作 过程同例8-1
четверг, 2
1.建立数据文件
在SPSS数据编辑窗,建立数据文件Li83.sav。
行变量:“组别”,Values为:1=“红花 散”,2=“安慰剂”
列变量:“效果”,Values为:1=“改善 ”,2=“无效”;
четверг, 2
四格表确切概率法的基本思想
在四格表周边合计固定不变的条件下,改 变某一格子的实际频数,列出a、b、c、d各种 组合的四格表,按公式8-9计算每个四格表的概 率,然后计算单侧或双侧累积概率,并与检验 水准α比较,作出是否拒绝H0的结论。
P ( a b )(c ! d )(a ! c)(b ! d )! a !b !c !d !n !
1122.59 15
18
卡方值
четверг, 2
2 检验的基本公式
2 (A T )2 d f(R 1 )C ( 1 ) T 上述基本公式由Pearson提出,因此软件上
常称这种检验为Peareson卡方检验,下面将要 介绍的其他卡方检验公式都是在此基础上发展起 来的。它不仅适用于四格表资料,也适用于其它
例8-1 用专用公式 计算 2 值:
2 (271 26 5 74)2 376 56.77 , df 1
276100 345 31
查
2界值表,
2 0.05 ,1
3.84
下结论:
2
2 0.05 ,1
3.84;
P 0.05,按 0.05水准,
拒绝
H
,接受
0
H
,可以认为疗效不同。
1
четверг, 2
频数变量:“频数”。
четверг, 2
2. spss操作过程
(1)在spss中调出数据文件Li8-3.sav (2)频数变量加权。 从菜单选择 Data→Weight Cases 弹出Weight Cases对话框,选择
Weight Cases by框,框内选入“频数 ”,即指定该变量为频数变量
2 值的大小反映了实际频数A与理论频数T的吻合程度
четверг, 2
2分布(chi-square distribution)
纵高
0.5 0.4 0.3 0.2 0.1 0.0
0
f(2)2(1/2)22(/21)e2/2
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
Karl Pearson (1857~1936) 英国统计学家 1901年10月与 Weldon,Galton 一起创办 Biometvika
четверг, 2
例8-1 某医院收治376例胃脘痛患者,随机分 为两组,分别用新研制的中药胃金丹和西药治疗。 结果如表8-1,探讨两药疗效有无差别。
表8-1 两药治疗胃脘痛的疗效四格表
若不用校正公式,则2 = 4.06,P<0.05.,结论
相反
четверг, 2
1.建立数据文件
在SPSS数据编辑窗,建立数据文件Li81.sav。
行变量:“组别”,Values为:1=“通塞 脉1号”,2=“活血温经汤”
列变量:“疗效”,Values为:1=“有效 ”,2=“无效”;
频数变量:“频数”。
因有理论数1<T<5,n>40,故用校正2检验
четверг, 2
27 1(26 273671 /2)2 2.75
33 38 62 9 df1
(3)确定P值,作结论
查界值表, 0 2 .0(1 5)3.8, 420 2 .05P>0.05,按
α=0.05水准不拒绝H0,不能认为两法疗效不同。
Weight Cases by框,框内选入“频数 ”,即指定该变量为频数变量
четверг, 2
加权变量
четверг, 2
(3) 2检验
从菜单选择 Analyze→Descriptive
Statistics→Crosstable(交叉表) 指定 Row(s):组别 Columns(s):疗效 击Statistics按钮选择Chi-square。
疗法 胃金丹 西药 合计
有效
无效
271(253.24) 5(22.76)
74(91.76) 26(8.24)
345
31
合计 276 100 376
有效率 98.19% 74.00% 91.76%
четверг, 2
列联表资料分析
把全部数据按两个分类变量(原因变量、结 果变量)进行完全分类列成的频数表格称为列联 表,R行C列的列联表简称R×C表,2×2列联表 也称为四格表,利用列联表进行分类资料的检验 称为列联表分析。
理论无效数: T12=276 -253.24=22.76,
T22=100 -91.76=8.24 четверг, 2
理论数公式
Trc
nrnc n
,nr表示r第 行的合计数;
nc表示c第 列的合计n数 表; 示总合计。
271
5
74
26
253.24
2
91.76
четверг, 2
衡量理论数与实际数的差别
1.建立数据文件
在SPSS数据编辑窗,建立数据文件Li81.sav。
行变量:“组别”,Values为:1=“胃金 丹”,2=“西药”
列变量:“疗效”,Values为:1=“有效 ”,2=“无效”;
频数变量:“频数”。
четверг, 2
2. spss操作过程
(1)在spss中调出数据文件Li8-1.sav (2)频数变量加权。 从菜单选择 Data→Weight Cases 弹出Weight Cases对话框,选择
2 检验(Chi-square test)是现代统计学的
创始人之一,英国人K . Pearson(1857-1936 )于1900年提出的一种具有广泛用途的统计方 法,可用于两个或多个率间的比较,计数资料 的关联度分析,拟合优度检验等等。
本章仅限于介绍两个和多个率或构成比比较
的 2检验。
четверг, 2
(3) 2检验
从菜单选择 Analyze→Descriptive
Statistics→Crosstable(交叉表) 指定 Row(s):组别 Columns(s):疗效 击Statistics按钮选择Chi-square。
четверг, 2
输出结果
理论数小于5的格子数为2(占50%),最小理论数为4.18 卡方检验:有效观测数 n=71>40,有两个格子理论数T<5,故用
结果分析:Pearson 2=56.77,双侧P=
0.000<0.05,以α=0.05水准拒绝H0,差 异有统计学意义,可认为两药疗效不同。
четверг, 2
三、四格表 2检验的应用条件
(1)当n≥40,且所有T≥5时,用Pearson 2 检验 (2)当n≥40,而有1≤T<5时,用校正2检验
четверг, 2
一、卡方检验的基本思想
例8-1 对表8-1资料推断两药的疗效有无差别
H0: 1 2,即两药总体有效率相等
由于总体有效率未知,将两组数据合并,计算合并
样本有效率(称为理论有效率)
p =345/376=91.76%,
据此推算两组的理论有效数:
T11=276×345/376=253.24, T21=100×345/376=91.76,
2分布是一连续型分布,而四格表资料属离散型
分 布 , 对 其 进 行 校 正 称 为 连 续 性 校 正 (correction for continuity), 又 称 Yates 校 正 ( Yates' correction)。
четверг, 2
(3) 2检验
从菜单选择 Analyze→Descriptive
Statistics→Crosstable(交叉表) 指定 Row(s):组别 Columns(s):效果 击Statistics按钮选择Chi-square。
четверг, 2
输出结果
четверг, 2
结果分析
检验统计量 2 值:
2R,C(A rcTrc)2 ( AT) 2
T r,c1
rc
T
четверг, 2
2(27125.324)2(522.76)2(7491.76)2
25.324
22.76
91.76
(268.24)256.77 8.24
df(21)(21)1
Pearson 2 值近似服从自由度为 df=(R-1)(C-1)的 2 分布
本章结构
第一节 四格表 2检验
第二节 四格表确切概率法
第三节 R×C 表资料的 2检验
第四节 配对四格表资料的 McNemar检验
第五节 多个样本率的两两比较
четверг, 2
第一节 四格表 2检验
卡方检验的基本思想 四格表专用公式 四格表卡方检验的应用条件 校正卡方检验
четверг, 2
2 检验
четверг, 2
2. spss操作过程
(1)在spss中调出数据文件Li8-2.sav (2)频数变量加权。 从菜单选择 Data→Weight Cases 弹出Weight Cases对话框,选择
Weight Cases by框,框内选入“频数 ”,即指定该变量为频数变量
четверг, 2
由总频数n=37<40,使用Fisher Exact Test(Fisher精确检验)。
由Fisher精确检验双侧P= 0.001 <0.05 ,以α=0.05水准拒绝H0,差异有统计学 意义,可以认为红花散能够改善周围血 管闭塞性病变患者的皮肤微循环状况。
четверг, 2
表8-4 两组疗效比较
疗法
有效
无效
合计
通塞脉1号
26
7
33
活血温经汤
36
2
38
合计
62
9
71
четверг, 2
例8-2 对表8-4资料推断两组的疗效有无差别
(1) H0: 1 2 ,即两组疗效相同
H1: 1 2 ,即两组疗效不同 , α=0.05
(2)计算2值,最小理论数
933
T12
4.18 71
четверг, 2
列联表分析
четверг, 2
统计量
卡方 检验
一致性检验 危险度分析
配对四格表卡 方检验
четверг, 2
主要输出结果
校正只适用于四格表 理论数小于5的格子数为0(占0%),最小理论数为8.24
четверг, 2
结果分析
由总频数n=376>40,最小理论频数8.24 >5,使用Pearson卡方检验。
校正卡方检验2 =2.746,P=0.098,不能认为两药疗效不同。
четверг, 2
第二节 四格表确切概率法
四格表确切概率法基本思想 实例
четверг, 2
➢四格表资料:当①总例数n<40; ➢②用其他方法所得概率接近检验水准α; ➢③四格表中有实际频数A=0; ➢④四格表中有理论频数T<1。 ➢应采用四格表确切概率法。四格表确切概率法 系英国统计学家Fisher于1934年提出,又称 Fisher精切概率法(Fiser s exact test)
четверг, 2
四、连续性校正公式
校正公式:
2 (AT0.5)2, T
2 (ad bc n/2)2n
(ab)c (d)a (c)b (d)
четверг, 2
校正 2 检验
例8-2 某中医院将71例血栓闭塞性脉管炎Ⅲ 期2~3级患者随机分为两组,分别用活血温经汤 和通塞脉1号治疗。结果如表8-4,推断两药疗效 有无差别。
的“行×列表”资料。
четверг, 2
二、四格表专用公式
为了不计算理论频数T, 可由基本公式推导出,
直接由各格子的实际频数(a、b、c、d)计算卡方 值的公式:
基 本 公2式 : (AT)2
T
(adb)c2n
(ab)(cd)(ac)(bd)
df1
-------四格表专用公式
четверг, 2
четверг, 2
例8-3 研究中药制剂红花散改善周围血管闭 塞性病变患者的皮肤微循环状况,以安慰剂作对 照,将37个病例随机分到两组,结果如表8-5 , 分析红花散的疗效。
表8-5 红花散改变缺血组织皮肤微循环资料
组别
改善
无效
合计
红花散
15
5
20
安慰剂
3
14
17
合计
18
19
பைடு நூலகம்
37
четверг, 2
H0:红花散无效, H1:红花散有效 。α=0.05 n=37<40 采用四格表确切概率法。Spss操作 过程同例8-1
четверг, 2
1.建立数据文件
在SPSS数据编辑窗,建立数据文件Li83.sav。
行变量:“组别”,Values为:1=“红花 散”,2=“安慰剂”
列变量:“效果”,Values为:1=“改善 ”,2=“无效”;
четверг, 2
四格表确切概率法的基本思想
在四格表周边合计固定不变的条件下,改 变某一格子的实际频数,列出a、b、c、d各种 组合的四格表,按公式8-9计算每个四格表的概 率,然后计算单侧或双侧累积概率,并与检验 水准α比较,作出是否拒绝H0的结论。
P ( a b )(c ! d )(a ! c)(b ! d )! a !b !c !d !n !
1122.59 15
18
卡方值
четверг, 2
2 检验的基本公式
2 (A T )2 d f(R 1 )C ( 1 ) T 上述基本公式由Pearson提出,因此软件上
常称这种检验为Peareson卡方检验,下面将要 介绍的其他卡方检验公式都是在此基础上发展起 来的。它不仅适用于四格表资料,也适用于其它
例8-1 用专用公式 计算 2 值:
2 (271 26 5 74)2 376 56.77 , df 1
276100 345 31
查
2界值表,
2 0.05 ,1
3.84
下结论:
2
2 0.05 ,1
3.84;
P 0.05,按 0.05水准,
拒绝
H
,接受
0
H
,可以认为疗效不同。
1
четверг, 2
频数变量:“频数”。
четверг, 2
2. spss操作过程
(1)在spss中调出数据文件Li8-3.sav (2)频数变量加权。 从菜单选择 Data→Weight Cases 弹出Weight Cases对话框,选择
Weight Cases by框,框内选入“频数 ”,即指定该变量为频数变量
2 值的大小反映了实际频数A与理论频数T的吻合程度
четверг, 2
2分布(chi-square distribution)
纵高
0.5 0.4 0.3 0.2 0.1 0.0
0
f(2)2(1/2)22(/21)e2/2
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
Karl Pearson (1857~1936) 英国统计学家 1901年10月与 Weldon,Galton 一起创办 Biometvika
четверг, 2
例8-1 某医院收治376例胃脘痛患者,随机分 为两组,分别用新研制的中药胃金丹和西药治疗。 结果如表8-1,探讨两药疗效有无差别。
表8-1 两药治疗胃脘痛的疗效四格表
若不用校正公式,则2 = 4.06,P<0.05.,结论
相反
четверг, 2
1.建立数据文件
在SPSS数据编辑窗,建立数据文件Li81.sav。
行变量:“组别”,Values为:1=“通塞 脉1号”,2=“活血温经汤”
列变量:“疗效”,Values为:1=“有效 ”,2=“无效”;
频数变量:“频数”。
因有理论数1<T<5,n>40,故用校正2检验
четверг, 2
27 1(26 273671 /2)2 2.75
33 38 62 9 df1
(3)确定P值,作结论
查界值表, 0 2 .0(1 5)3.8, 420 2 .05P>0.05,按
α=0.05水准不拒绝H0,不能认为两法疗效不同。
Weight Cases by框,框内选入“频数 ”,即指定该变量为频数变量
четверг, 2
加权变量
четверг, 2
(3) 2检验
从菜单选择 Analyze→Descriptive
Statistics→Crosstable(交叉表) 指定 Row(s):组别 Columns(s):疗效 击Statistics按钮选择Chi-square。
疗法 胃金丹 西药 合计
有效
无效
271(253.24) 5(22.76)
74(91.76) 26(8.24)
345
31
合计 276 100 376
有效率 98.19% 74.00% 91.76%
четверг, 2
列联表资料分析
把全部数据按两个分类变量(原因变量、结 果变量)进行完全分类列成的频数表格称为列联 表,R行C列的列联表简称R×C表,2×2列联表 也称为四格表,利用列联表进行分类资料的检验 称为列联表分析。
理论无效数: T12=276 -253.24=22.76,
T22=100 -91.76=8.24 четверг, 2
理论数公式
Trc
nrnc n
,nr表示r第 行的合计数;
nc表示c第 列的合计n数 表; 示总合计。
271
5
74
26
253.24
2
91.76
четверг, 2
衡量理论数与实际数的差别
1.建立数据文件
在SPSS数据编辑窗,建立数据文件Li81.sav。
行变量:“组别”,Values为:1=“胃金 丹”,2=“西药”
列变量:“疗效”,Values为:1=“有效 ”,2=“无效”;
频数变量:“频数”。
четверг, 2
2. spss操作过程
(1)在spss中调出数据文件Li8-1.sav (2)频数变量加权。 从菜单选择 Data→Weight Cases 弹出Weight Cases对话框,选择
2 检验(Chi-square test)是现代统计学的
创始人之一,英国人K . Pearson(1857-1936 )于1900年提出的一种具有广泛用途的统计方 法,可用于两个或多个率间的比较,计数资料 的关联度分析,拟合优度检验等等。
本章仅限于介绍两个和多个率或构成比比较
的 2检验。
четверг, 2
(3) 2检验
从菜单选择 Analyze→Descriptive
Statistics→Crosstable(交叉表) 指定 Row(s):组别 Columns(s):疗效 击Statistics按钮选择Chi-square。
четверг, 2
输出结果
理论数小于5的格子数为2(占50%),最小理论数为4.18 卡方检验:有效观测数 n=71>40,有两个格子理论数T<5,故用
结果分析:Pearson 2=56.77,双侧P=
0.000<0.05,以α=0.05水准拒绝H0,差 异有统计学意义,可认为两药疗效不同。
четверг, 2
三、四格表 2检验的应用条件
(1)当n≥40,且所有T≥5时,用Pearson 2 检验 (2)当n≥40,而有1≤T<5时,用校正2检验
четверг, 2
一、卡方检验的基本思想
例8-1 对表8-1资料推断两药的疗效有无差别
H0: 1 2,即两药总体有效率相等
由于总体有效率未知,将两组数据合并,计算合并
样本有效率(称为理论有效率)
p =345/376=91.76%,
据此推算两组的理论有效数:
T11=276×345/376=253.24, T21=100×345/376=91.76,